Wikidata est un projet de la Wikimedia Foundation : une base de données libre et collaborative. La présentation du projet en détail est disponible sur le site même du projet : Wikidata:Introduction.

Le but de cette page est de discuter entre contributeurs de ces deux projets autour des coopérations que l’on pourrait mettre en place, l’articulation et les apports potentiels d’un projet pour l’autre.

Historique des discussions sur le Wiktionnaire à propos de Wikidata : septembre 2012, mars 2013, mai 2013, juin 2013, août 2014, décembre 2015, janvier 2016, juin 2016, septembre 2016, février 2017, aout 2017, mars 2018, avril 2018

Sur Meta : Wiktionary future (en anglais) et sur Wikidata : Wiktionnaire (en anglais).

Coopérations dans la structure actuelle

Wikidata vers Wiktionnaire

Comment les données de Wikidata pourraient être exploitées par le Wiktionnaire ?

Il s’agit dans cette partie de réfléchir et de mettre en place des outils pour faire évoluer le Wiktionnaire grâce à l’aide de Wikidata. Une première idée proposée par @VIGNERON : générer des listes d’items qui servent de bases pour des thésaurus sur le Wiktionnaire.

Bonjour,

Je connais assez bien Wikidata, clairement pour le moment, on en est encore au stade de la réflexion, voir d:Wikidata:Wiktionary et dans les nombreuses ]], sous-pages (notamment sur l’alignement des deux structures propres aux deux projets).

Par contre, il y a déjà quelques choses que l’on peut déjà facilement faire. Peut-être pas des thésaurus per se mais en tout cas déjà des suggestions.

Quelques exemples :

sur Wikidata on a propriété pour lier vers le Dictionary of Medieval Names from European Sources entry (d:Property:P1888) qui est utilisée sur 526 éléments : dont voici liste, à utiliser en source ?
ou bien voilà la liste des prénoms masculins et des prénoms féminins associées ; à utiliser dans la section noms dérivés ?

Après, c’est aussi à vous de dire ce que vous souhaitez (n’hésitez pas à demander la Lune

).

Cdlt, VIGNERON * ^discut. 25 juin 2016 à 17:19 (UTC)

Oui ça paraît une excellente idée pour les prénoms. Pour peu que Wikidata soit suffisamment complet, on pourrait peut-être générer des histogrammes d’usage dans le temps et l’espace par exemple. Je ne sais pas si Wikidata permet déjà d’inclure ce type de représentation dans les articles par conter. --Psychoslave (discussion) 27 juin 2016 à 20:12 (UTC)

Excellente idée. Pour l’affichage dans le Wiktionnaire, je crois t’avoir déjà mentionné mw:extension:Graph (un peu trop technique pour moi mais pour un cas particulier comme celui qu tu mentionnes, il est sans doute possible de créer un modèle). Au niveau des données, on ne peux évidemment ne récupérer de Wikidata que ce qui est dans Wikidata ; avis aux volontaires pour compléter les données là-bas

. Cdlt, VIGNERON * ^discut. 27 juin 2016 à 22:14 (UTC)

Voilà la liste des prénoms… : j’ai essayé de cliquer, et c’est incroyablement abscons. Je ne vois pas de listes de prénoms. J’ai aussi essayé de cliquer sur Show et de saisir un prénom, mais je ne suis arrivé à rien, même avec des prénoms très courants. Lmaltier (discussion) 27 juin 2016 à 20:53 (UTC)

@Lmaltier : il faut cliquer sur « Run ». La page que donne VIGNERON sert à faire des requêtes sur la base de données ; cliquer sur « Run » permet de lancer la requête. Pamputt ^[Discuter] 27 juin 2016 à 21:33 (UTC)

Ooups, oui désolé de l’oubli. Cdlt, VIGNERON * ^discut. 27 juin 2016 à 22:14 (UTC)

Prononciation

Je suppose que les différentes prononciations régionales d’un mot pourraient être affichées en utilisant les infos de Wikidata : on insérerait dans la section Prononciations un modèle "pron-rég-wikidata" par exemple, qui afficherait toutes les prononciations régionales disponibles, avec un petit lien pour modifier les prononciations en question quand elles sont incorrectes. Vu la quantité de langues que nous incluons et la quantité d’accents possibles par langue, ce serait une information trop fastidieuse à recopier à la main, et pourtant identique pour toutes les versions du projet. — Automatik (discussion) 25 juin 2016 à 23:22 (UTC)

Tout à fait d’accord. D’autant plus que récupérer cette info depuis Wikidata ne pose plus de soucis que récupérer le fichier depuis Commons. Reste à voir s’il serait possible/souhaitable de développer un gadget javascript dans le but d’ajouter directement une prononciation qu’on aurait téléverser sur Commons sur Wikidata. Pamputt ^[Discuter] 26 juin 2016 à 11:25 (UTC)

Faisable, mais attendez la fin de la première étape de développement de Lingua Libre. — Lyokoï (Parlons

) 15 septembre 2016 à 15:44 (UTC)

Traitement des erreurs et des contradictions

Comment cela peut-il être possible de gérer des cas où un contributeur francophone donne un renseignement (peu importe sur quelle langue) à Wikidata (sans quitter le Wiktionnaire) et un contributeur anglophone met le même renseignement à jour, mais avec un renseignement différent ? Normalement, dans ce genre de cas, les deux contributeurs discutent pour arriver à un accord, mais puisque ce ne sera pas possible dans ce cas, comment cela peut-il être traité ? Lmaltier (discussion) 27 juin 2016 à 20:37 (UTC)

Chaque futur élément correspondant à une suite de mots (L1 par exemple) disposera d’une page de discussion. On peut donc imaginer que si quelqu’un ajoute une information en français, il comprend le français et donc que la discussion peut avoir lieu sur la page de discussion en français (en ce qui concerne ce cas précis). On aurait un comportement similaire à ce qui existe déjà ici : si quelqu’un ajoute un mot en français, on lui parle en français sauf si on voit qu’il ne parle pas cette langue et on utilise alors l’anglais. Pamputt ^[Discuter] 27 juin 2016 à 20:54 (UTC)

+1 avec Pamputt, ton cas me semble très rare (si ce n’est inexistant) et la discussion est toujours possible (éventuellement en demandant de l’aide à un tiers bilingue comme je l’ai déjà vu parfois). Cdlt, VIGNERON * ^discut. 27 juin 2016 à 22:21 (UTC)

Vous ne pensez pas à tous les cas. Si quelqu’un rajoute un renseignement sur un mot latin, par exemple, ce n’est pas pour ça qu'il est forcément à l’aise pour participer à une discussion en latin (en général, même, il aura beaucoup de mal). Et passer par l’intermédiaire d’un tiers, franchement, qui l’accepterait ? C’est éventuellement possible seulement pour transmettre un avis discuté dans sa propre langue vers un autre projet, mais une discussion doit toujours se faire dans une langue commune. Et si un contributeur roumain et un contributeur portugais se contredisent sur le renseignement sur le mot latin, peut-on s’attendre à trouver facilement un contributeur parlant à la fois roumain et portugais ? Il vaut bien mieux que chacun modifie son propre projet uniquement, et que des robots établissent des listes d’incohérences, ces listes d’incohérences restant toujours disponibles, et pouvant donc être traitées dès qu’une personne compétente se trouve disponible, éventuellement nettement plus tard. OmegaWiki avait déjà siphonné un des contributeurs les plus importants du Wiktionnaire, séduit par le concept, mais qui a apparemment fini par voir que le projet était du temps perdu. C’est aussi ça que je crains. Lmaltier (discussion) 28 juin 2016 à 17:18 (UTC)

@Lmaltier : ça ne change rien à la situation actuelle. Par exemple Nataraj (d · c · b) contribue ici bien qu’il (elle) ne parle pas français mais uniquement russe et anglais. Et ça ne choque personne. Sur Wikidata ce sera la même chose, il est plus que probable que les Français renseignent en majorité des articles en français tandis que les locuteurs d’autres langues renseignent des éléments de leur langue et si discussion il doit y avoir elle aura lieu soit dans la langue de l’élément en question (portugais, russe, français) ou bien une langue commune aux deux locuteurs (anglais, français, espagnol, …) comme c’est déjà le cas ici (pas besoin de Wikidata pour ça). Pamputt ^[Discuter] 28 juin 2016 à 17:28 (UTC)

Et en latin ? Et en araméen ? Sérieusement ? Ce que je veux dire, c’est qu’un wiki multilingue, c’est ingérable si on veut pouvoir avoir des discussions. On ne peut pas en citer un seul qui ait réussi. Bien sûr, actuellement, on peut contribuer sur un wiki sur lequel on est incapable de discuter, c’est possible sur certains points, mais le principe est quand même que nous avons notre langue de rédaction et de discussion, et c’est absolument fondamental pour un wiki. C’est tout le problème d’introduire une zone commune à toutes les langues. Ceux qui négligent ce point sont ceux qui connaissent l’anglais et qui imaginent que tout contributeur qui se respecte se doit aussi de connaître l’anglais. Je refuse de me résigner à ce point de vue : je peux personnellement discuter en anglais, mais je sais que beaucoup ne peuvent pas ou n’osent pas. Je pense qu'un des grands risques de disparition progressive des langues est l’existence de structures multinationales et multilingues (comme dans notre cas) qui se résignent à une prééminence de fait de l’anglais. Je connais très bien, pour des raisons professionnelles, le cas des projets financés par l’Union Européenne qui, en pratique, se passent toujours en anglais. Même quand une réponse à appel d’offres n’est pas en anglais (ce qui est autorisé en théorie, même si ça n’arrive pas), la Commission réclame un résumé en anglais. Quand des langues passent insensiblement au statut de simples langues régionales derrière une autre langue principale, il y a sérieux danger à long terme, il ne faut pas se boucher les yeux. Lmaltier (discussion) 28 juin 2016 à 17:50 (UTC)

Sur ce point je te rejoins entièrement. Je dis juste que le cas que tu décris n’est pas lié à Wikidata. D’autant plus que la prise en charge du Wiktionnaire par Wikidata ne signifie pas la fin du Wiktionnaire en lui-même. Wikidata n’est qu’un outil. Après libre à chaque projet d’utiliser ou non les informations présentes dans Wikidata pour enrichir ce projet. Pamputt ^[Discuter] 28 juin 2016 à 18:45 (UTC)

C’est lié dans la mesure où Wikidata serait une partie commune nécessitant parfois des discussions, et cela sans langue commune de discussion (donc en utilisant en pratique l’anglais, comme sur OmegaWiki, malgré tout ce qui avait été dit au départ). Tant qu’il n’y a pas besoin de discussion (interwikis), ça va. Mais si les non-anglophones se sentent dépossédés ne serait-ce qu’en partie de leur projet, ça n’incite pas à participer. Lmaltier (discussion) 28 juin 2016 à 20:16 (UTC)

Ce serait intéressant de comparer une courbe montrant l’évolution du nombre de contributeurs de Wikipédia mise en parallèle avec une courbe montrant la montée en puissance de l’utilisation de Wikidata. J’imagine que l’influence de Wikidata serait plutôt négative, mais j’aimerais bien confirmation. Lmaltier (discussion) 29 juin 2016 à 20:27 (UTC)

Lmaltier (d · c · b) voici quelques courbes sur la Wikipédia en français, il n'y a aucune statistiques précises sur l’utilisation de Wikidata mais de toute façon celle-ci reste globalement très faible. Pour la langue, l’anglais n’est pas la langue majoritaire sur Wikidata (il n'y a pas vraiment de langue majoritaire globale et si on veut cherche la langue la plus commune, ce serait plutôt le français, voir notamment le top 50 des wikidatiens les plus actifs où il y a plus d'une dizaine de francophones). Cdlt, VIGNERON * ^discut. 1 juillet 2016 à 12:30 (UTC)

Quand je regarde la page de discussion du projet, pourtant, je ne vois que de l’anglais (même si je choisis le français comme langue préférée). Par curiosité, j’ai regardé mes contributions, et j’ai vu des choses que je n’ai pas du tout comprises. Je comprends quand même que Wikidata a pris en compte mon renommage sur Wikipédia de Verre Libyque en Verre libyque mais, malgré cette prise en compte, Wikidata conserve néanmoins Verre Libyque comme nom de référence en français. Tout ça est incompréhensible. Lmaltier (discussion) 1 juillet 2016 à 17:03 (UTC)

Concernant verre lybique, il y a 2 choses : tu as changer le nom du lien interwiki vers Wikipédia francophone. Ton incompréhension vient du fait que le libellé n’a pas été modifié (je viens de le faire). Pamputt ^[Discuter] 1 juillet 2016 à 19:36 (UTC)

Je vois qu'il y a des pages de discussion spéciales dans quelques langues, accessibles via la colonne de gauche en fonction de la langue qu’on a choisie. Mais cela ne résout absolument pas le problème que je soulève : discussion entre personnes de langues différentes, et aussi entre personnes sans langue commune. Lmaltier (discussion) 1 juillet 2016 à 17:17 (UTC)

Tu as raison, si 2 personnes n’ont aucune langue commune alors elles ne pourront pas communiquer entre elles. Si il y guerre d’éditions, ça se traduira probablement par un message sur le bistro des administrateurs qui serviront de traducteurs et d’arbitres comme c’est le cas actuellement. Ou alors rien ne se passe et chacun continue sa route chacun de son côté. Mais comme je l’ai déjà dit avant c’est déjà possiblement le cas sur le Wiktionnaire francophone pour les contributeurs non-francophones. Pamputt ^[Discuter] 1 juillet 2016 à 19:36 (UTC)

Sur le Wiktionnaire francophone, le problème ne se pose pas : la langue du projet étant le français, aucun contributeur ne parlant pas français n’oserait se conduire de cette façon (et s’il le faisait, il lui serait donné a priori tort si on n’arrivait pas à comprendre la raison de ses changements). Lmaltier (discussion) 1 juillet 2016 à 20:16 (UTC)

Noms et hiérarchie des langues

Le WikiProjet Langues sur Wikidata vise à renseigner les propriétés de toutes les langues. Sont ainsi pris en charge les différents codes de langues ainsi que la hiérarchie des langues suivant les familles de langue auxquelles elles appartiennent. À terme, il est plus que souhaitable de remplacer ou d’adapter notre Module:langues par les données provenant de Wikidata vu que ces informations sont redondantes. On pourra même envisager (à voir la faisabilité sur le plan technique) de trier les traductions par famille de langues au lieu de l’ordre alphabétique (au choix ?). Pamputt ^[Discuter] 29 juin 2016 à 19:27 (UTC)

Pas très fan. Mon travail sur les langues de France implique des choix pratiques qui ne reflètent pas la réalité linguistique… — Lyokoï (Parlons

) 1 juillet 2016 à 14:50 (UTC)

Citations

Actuellement, quand Wikidata indique une source, on utilise le modèle {{source}} et on remplit et on met en forme les informations à la main (l’auteur, le titre, l’année, l’URL, etc.). Or il serait facilement possible de récupérer ces informations à partir de Wikidata (d’autant plus si l’ouvrage vient de Wikisource puisque les wikisourciers mettent de plus en plus ces données dans Wikidata). On peut imaginer même de mettre la citation elle-même dans Wikidata (là encore, d’autant plus facilement si elle est issue d'un ouvrage du domaine public). Il a même possible de créer un outil intégré au Wiktionnaire pour faire tout cela sans quitter le Wiktionnaire. Cdlt, VIGNERON * ^discut. 16 septembre 2016 à 18:34 (UTC)

Requête SPARQL et affichage de cartes

En juillet 2016, VIGNERON a montré qu’il est possible de faire une requête SPARQL simple permettant d’afficher une carte affichant toutes les villes se finissant par tel ou tel suffixe. L’extension « graph » semble pouvoir afficher sur des cartes le résultat de requête SPARQL. J’ai fait quelques tests ici sans grand succès pour le moment. Si on arrive à faire fonctionner cela, on pourrait créer un modèle adéquat simplifiant le code de l’extension et cela permettrait d’afficher des cartes avec des données linguistiques sur des dizaines d’articles. Pamputt ^[Discuter] 16 septembre 2016 à 05:39 (UTC)

Salut,

J’ai regardé rapidement mais je suis un peu perdu (le premier exemple fait deux requêtes SPARQL dont je ne comprends pas bien comment sont transmis les informations à Graph… et tout le reste du code spécifique à Graph m’est difficilement compréhensible). J’ai finalement réussi à force de bidouille à faire quelque chose qui affichait un résultat (la taille des points étaient fonction de la population, alors que l’on ne récupérait pas la population). Je notifie

@Benoît Prieur : qui s’y connait bien l’extension graph (il me semble) et qui pourrait encore améliorer la chose.

Oui, l'idéal serait de faire un modèle avec juste 2-3 paramètres comment "debut/fin" et l’affixe.

Si vous avez d’autres idées de cartes, n’hésitez pas à demander, je pourrais vous dire si c’est possible ou non avec les données de Wikidata.

Cdlt, VIGNERON * ^discut. 16 septembre 2016 à 09:02 (UTC)

Wiktionnaire vers Wikidata

Quelles informations du Wiktionnaire pourraient être réutilisées dans Wikidata ? De quelles manières ? Quelles sont les possibilités et envies ?

Il s’agit ici de poursuivre la discussion initiée en anglais sur la page Wikidata:Wiktionary

Pour l’instant j’ai du mal à savoir exactement en quoi le Wiktionnaire intéresse Wikidata, ce que ça pourrait apporter de plus d’avoir des informations fractionnées plutôt que des liens vers les Wiktionnaires. Des idées ?

Noé 27 juin 2016 à 23:01 (UTC)

L'idée est d'organiser aussi l'information pour que celle-ci soit facilement consommable par les ordinateurs et donc par les humains. Par exemple, en représentant l'information d’étymologie dans wikidata on peux facilement afficher les suites de mot racine qui ont conduit à la création d'un mot en particulier alors qu'actuellement il faut parcourir les pages aller de lien en lien pour découvrir l'origine d'un mot. Donc en gros c'est simplifier le travail des ordinateurs pour simplifier le travail des humains. iamamz3 (discussion) 11 septembre 2016 à 16:58 (UTC)

Pour poursuivre sur l'utilisation de wikidata en général en informatique cela rentre dans la catégorie de la création d'ontologie que l'on va pouvoir naviguer parallèlement à la navigation d'un document pour en comprendre le contenu. Par exemple, dans le cadre de la création d'un moteur de recherche par concept, on peux vouloir faire une recherche sur «Quelles armes de chimiques ont été utilisé dans la première guerre du Vietnam?» l'ordinateur peux lire le mot arme comprendre qu'il s'agit du premier sens, le relier au concept wikidata de «weapon» continuer la lecture de la phrase et comprendre qu'il y a un lien avec le concept d'agent biologique en français demander la liste des agents biologique et faire une recherche conjointe sur «Vietnam» et la liste des agents biologique exemple: «Guerre vietnam (Napalme OR "gaz sarin")». Autre exemple, informatiquement les mots sont représenté par lexeme plus l'information sur sur le type de lexeme (adj, verbe, nom commun, nom propre), le temps dans le cas des verbes, le pluriel, le feminin/masculin etc... mais plus souvent qu'autre chose dans la nature c'est des dérivés qui existent. Typiquement pour les mots "regulier" tel que «maison», on peux faire deviner à l'ordinateur que le lexeme «maisons» c'est «maison» mais dés qu'on rentre dans des cas irrégulier comme «chevaux → cheval» une ontologie permet de plus facilement faire le lien. En informatique la science qui s'occupe de ce genre de chose s'appelle le Traitement Automatique du Langage (TAL ou TALN) Iamamz3 (discussion) 11 septembre 2016 à 17:28 (UTC)

Je m’intéresse énormément à ce genre de sujet. Par exemple, je suis même persuadé qu’on pourra arriver un jour arriver à un traducteur automatique "cultivé" et se tenant au courant de l’actualité, pouvant traduire même un roman de façon correcte, en ne nécessitant qu’une relecture par un être humain. Mais il ne faut jamais oublier qu'un wiki, pour fonctionner, nécessite de nombreux contributeurs. Tout ce qui peut aboutir au résultat inverse est catastrophique pour le wiki. Lmaltier (discussion) 11 septembre 2016 à 18:00 (UTC)

Pour fonctionner ce type de système a besoin de beaucoup de contributeurs ;) Iamamz3 (discussion) 11 septembre 2016 à 19:22 (UTC)

C’est ce que je dis. Et ma grande crainte, c’est qu'ils disparaissent petit à petit (voir mes autres commentaires dans cette page). Lmaltier (discussion) 12 septembre 2016 à 05:40 (UTC)

Lmaltier (d · c · b) Il y a déjà 6 834 contributeurs sur Wikidata (ce qui en fait un des plus projets de la Wikimedia Foundation), pour comparaison, il n'y en a que 109 sur le Wiktionnaire francophone. Une fuite des cerveaux me semble illusoire ; et quand bien même, ce ne serait pas une perte pour le Wiktionnaire mais juste un déplacement partiel vu que ce qui est sur Wikidata est centralisé pour tout les projets voulant le réutiliser. Plutôt que deux contributeurs « perdent du temps » à mettre deux fois la même information à deux endroits, un seul la met dans le dépôt central et le second a ainsi du temps de libre pour faire autre chose (typiquement pour faire toutes les choses que Wikidata ne pourra jamais faire car trop complexe pour être modélisé). Cdlt, VIGNERON * ^discut. 16 septembre 2016 à 18:44 (UTC)

Création d’une base de données lexicale pour Wiktionnaire

La question de l’évolution technologique de l’outil qui soutient le Wiktionnaire se pose depuis les débuts du projet. Le principe du Wiki est très porteur mais Mediawiki n’est pas particulièrement adapté à un travail lexicographique. Les Wiktionnaires ont plus ou moins évolués technologiquement grâce à des personnes fantastiques qui ont su développer des aménagements et renforts pour continuer à faire croitre le projet malgré ses failles. Pourtant, les constats de problèmes de redondance de l’information sont nombreux et chaque nouveau Wiktionnaire doit repartir de zéro sans pouvoir profiter du travail déjà bien avancé par les autres. Une mise en commun des données pourrait profiter aux Wiktionnaires, ainsi qu’aux autres projets collaboratifs en ligne.

D’où ça sort ?

Cette page de discussion communautaire émerge d’une rencontre mondiale autour du Wiktionnaire durant la convention annuelle Wikimania 2016. La rencontre a été organisée après une présentation faite sur les avancées du Wiktionnaire francophone et a permis de réunir 23 personnes pour discuter du Wiktionnaire. Participaient notamment trois personnes en charge du développement de Wikidata, dont la responsable en chef, @Lydia Pintscher (WMDE) :). Il y avait de leur part une véritable motivation à faire évoluer techniquement les Wiktionnaires et à enfin faire avancer la discussion avec les communautés de contributeurs, qui n’ont pas été particulièrement attirés par la question jusqu’ici. Cette page vise donc à rediscuter entre francophone de la question avant de retourner faire une synthèse structurée de nos avis, attentes et craintes vis-à-vis de ce grand chantier.

Gains à bénéficier d’une base de données lexicale

Gestion dynamique des liens interwiki à graphie identique. Ce ne sont pas des interwikis similaires à Wikipédia et ils sont plus simples à gérer. Les développeurs de Wikidata considèrent qu’ils pourraient mettre en place ce gain là en trois jours.
Mise en commun d’informations stables permettant leurs réutilisations plus faciles d’un projet à l’autre : genre grammatical, flexions, prononciations, conjugaisons, rimes, etc.

Pertes ou risques d’avoir une base de données lexicale

Problèmes de communication entre les langues.
…

Affichage et modification

La création d’une base de données n’implique pas d’aller vers une autre page pour la mise à jour des données. Ce fut le cas dans les débuts de Wikidata mais l’évolution de l’Éditeur Visuel permet aujourd’hui de mettre à jour le contenu de Wikidata sans quitter Wikipédia. L’intégration de données provenant d’une base de données serait aussi invisible que l’est l’intégration de contenu par des modèles. Cette intégration serait d’autant facilité qu’évoluerait l’outil d’aide à la contribution, et il y a des personnes prêtes à faire évoluer cet outil.

Wiktionary.org

Les versions linguistiques du Wiktionnaire sont hébergées dans des sous-domaines de [wiktionary.org] qui n’est pas utilisé actuellement pour héberger des données structurées. Une réflexion pourrait être menée pour envisager les avantages et inconvénients d’avoir une base de données lexicale indépendante de [wikidata.org] qui serait hébergée à cette adresse.

Plus

Il est possible de maintenir l’ensemble des projets Wiktionary en même temps qu’une version centrale multilingue. Actuellement, ne pas spécifier la langue dans un lien vers un Wiktionary renvoie vers la version dans la même langue que la source, et cela pourrait être changé, progressivement. Noé

Moins

Toujours le même problème (il ne faut pas se boucher les yeux) : un wiki multilingue, ça n’a pas de sens. Si cela fonctionne en gros sur Commons, c’est parce que chaque élément est produit par un seul contributeur, ce qui limite fortement les besoins de discussion. Sinon, il faut forcément une langue commune pour ces discussions : l’anglais pour un wiki anglophone, le français pour un wiki francophone, etc. Lmaltier
- Il ne s’agit pas de fonctionner comme sur Commons, mais comme sur Wikidata, qui est une base de données. Il s’y déroulent de nombreuses discussions en français sur ce qui touche particulièrement au français, et il n’y a pas autant de besoin de discussions sur une base de données que dans la gestion de l’utilisation des données, qui resterait faite au sein de chaque projet. Nous pourrions décider ou non d’utiliser les informations présentes dans la base de données, et choisir comment les présenter à notre guise. Enfin, je réponds à ta critique mais celle-ci n’était pas formulée en réponse à la question posée ici. Dans cette section de la page, la question est de savoir s’il est préférable d’avoir une base de données indépendante de Wikidata ou non. Pour le débat plus général, je t’invite vers la partie un peu plus haut sur la page, que j’ai écris ultérieurement Noé 27 juin 2016 à 16:02 (UTC)
- C’est vrai que le multilinguisme n’est pas toujours facile mais cela a pourtant du sens et cela permet même que chacun s’enrichissent des autres, et surtout l’expérience montre que cela fonctionne depuis des dizaines d’années (et il y a bien d’autres exemple que Commons et Wikidata, meta, les incubateurs, etc.). Cela marche même particulièrement bien sur Wikidata pour plusieurs raisons : de nombreuses pages sont traduites selon la langue du lecteur (surtout les pages de contenus et d’aide), il y a des pages de discussions spécifiquement dans une langue pour rassembler les locuteurs d’une même langue (typiquement, il y a un Bistrot dans chaque langue et les pages de projets propre à un langue sont majoritairement dans cette langue, par exemple les discussions autour de la France se font en français sur la page du projet France). Cdlt, VIGNERON * ^discut. 27 juin 2016 à 22:28 (UTC)
  - Cela ne répond pas au problème de fond : pour un sujet qui concerne la France, c’est sans doute plus facile, mais sur un sujet qui concerne l’astronomie ou la biologie, par exemple ? L’utilité ou non d’une discussion avec quelqu’un ne dépend pas de la langue qu'il parle… Lmaltier (discussion) 29 juin 2016 à 20:20 (UTC)
    - Lmaltier (d · c · b) quel est le problème exactement ? si tu veux discuter de l’astronomie ou de la biologie en français, qu’est-ce qui t’en empêche ? Cdlt, VIGNERON * ^discut. 1 juillet 2016 à 12:21 (UTC)
      - S'il y a une guerre d’édition sur Wikidata sur ce genre de sujet entre deux personnes sans langue commune, un Français et un Chinois, par exemple, ou un Roumain et un Portugais, qu’est-ce qui se passe ? Ils ne peuvent pas discuter, et pourtant il y a urgence pour une discussion. S’il y a simplement un relevé des contradictions entre projets, par bot, cela permet de laisser le problème en suspens jusqu’à ce que quelqu’un puisse le gérer. Lmaltier (discussion) 1 juillet 2016 à 16:50 (UTC)
        Ben il y a assez peu de guerres d'éditions sur Wikidata, en pratique. C'est important de le souligner parce qu'il est contreproductif de se faire un avis sur un pire cas imaginaire qui n'arrive en pratique pas. Il y a des raisons à ça : le sourcage et le NPOV sont prévues à la racine. Et puis en cas de guerre d'édition, il est de bon sens de ne pas rester à deux à se taper dessus mais à faire venir des avis extérieurs. Donc probablement des gens qui sont capables de jouer les intermédiaires linguistiques ... J'ai du mal à comprendre ces réticences. TomT0m (discussion) 16 juillet 2016 à 07:49 (UTC)
        Quand on parle anglais, on peut avoir du mal à comprendre ces réticences, ceux qui ne connaissent pas l’anglais ou sont mal à l’aise avec l’anglais les comprennent beaucoup mieux. Un wiki implique en général de pouvoir discuter dans une langue commune. Mais quand on voit ce que ça a donné sur Omegawiki, on voit que c’est un sujet à prendre très au sérieux. Lmaltier (discussion) 16 juillet 2016 à 11:08 (UTC)
        @Lmaltier : Il s'est passé quoi sur Omégawiki ? Je suis pas au courant. Sinon perso je suis disponible en cas de problème de communication entre deux contributeurs pour traduire au besoin, je l'ai déjà fait par le passé. Il n'y a pas de raison que ça se passe moins bien que les communications entre contributeurs en général. Il y a aussi l'extension translate qui permet de traduire toutes les pages d'aides - j'en ai moi même traduit pas mal sur Wikidata. Et en dernier lieu, il me semble évident que les informations sur les mots français seront majoritairement discutées entre contributeurs francophones. TomT0m (discussion) 9 novembre 2016 à 19:57 (UTC)
        Je ne parle pas seulement de mots français, mais de mots de toutes langues, y compris de langues mortes dans lesquelles il est difficilement envisageable de discuter. Je pense que ça se passe bien uniquement parce que ceux qui ne parlent pas anglais évitent le projet. OmegaWiki partage au moins deux points communs avec Wikidata : cette absence d’une langue de discussion commune (sinon l’anglais, ce qui a fait que la seule langue de discussion en pratique était l’anglais), et ses concepts complètement incompréhensibles aux non-initiés. Et OmegaWiki a donc fini par mourir peu à peu, par ne plus avoir de contributeurs, ou quasiment, après avoir pris aux projets des contributeurs très précieux, qui s’y sont perdus. Lmaltier (discussion) 9 novembre 2016 à 20:11 (UTC)

Commentaires

Personne ne sait actuellement à quoi ressemblera la prise en charge du Wiktionnaire par Wikidata mais il est probable que les éléments du Wiktionnaire aient une nouvelle lettre. Actuellement, les éléments désignent des concepts et leur identifiants commencent par la lettre Q. Ainsi Q151 désigne-t-il le Wiktionnaire (le concept). Ce système d’identification ne pourra probablement pas s’appliquer aux entrées du Wiktionnaire qui ne désignent pas des concept mais des « suites de lettres ». On peut donc imaginer que les entrées du Wiktionnaire utiliseront une autre lettre, par exemple W. Ainsi a serait identifié par W1 par exemple. On peut ensuite imaginer que les éléments W pourront être liés aux éléments Q suivant des règles qui restent à définir. Mais si une autre lettre que Q est bien utilisée alors cela revient à avoir presque deux bases de données différentes et l’intérêt d’héberger cela sur wiktionary.org ou sur wikidata.org devient juste une question de choix. Dans ce cas, j’aurais quand même une préférence pour utiliser wikidata.org pour plus de clarté. Pamputt ^[Discuter] 26 juin 2016 à 21:56 (UTC)

Intéressante idée. Pour le fait que les entrées ne sont pas des concepts mais des suites de lettres, oui, ça a été compris par les développeurs de Wikidata qui voient bien les choses sous cet angle. Durant notre discussion à la Wikimania, ils ne m’ont pas précis l’aspect pratique des choses, mais il s’agissait bien pour eux d’avoir une base de données distincte. Quitte à choisir la lettre, j’aimerai assez L, pour lexème, lexique, langue

Noé 27 juin 2016 à 15:34 (UTC)

De toute façon, la lettre est indépendante de la langue, donc son choix est subjectif… — Automatik (discussion) 27 juin 2016 à 17:40 (UTC)

Je ne sais pas trop comment fonctionne les espaces de nom dans Wikidata. Si c’est par la lettre préfixé, pour ma part peu me chaux. En tout cas je suis heureux de voir que la conversation va bon train. :) --Psychoslave (discussion) 27 juin 2016 à 20:31 (UTC)

Intéressant ; pour ma part je serais prudent et je resterais surtout sur le « Personne ne sait actuellement à quoi ressemblera la prise en charge du Wiktionnaire par Wikidata » et je préfère me concentrer sur ce qui est déjà faisable en attendant ladite prise en charge afin justement de faciliter celle-ci quand elle arrivera. Juste une question : pourquoi un élément W1 sur la lettre A quand il y a déjà l’élément d:Q9659 depuis presque 4 ans ? (cet élément aurait bien besoin d’aide de lexicographes d’ailleurs). Cdlt, VIGNERON * ^discut. 27 juin 2016 à 22:34 (UTC)

@Vigneron : au moins pour une raison : la page de Wikidata concerne la lettre A indépendamment de sa casse, alors que pour les Wiktionnaires le A est avant tout un caractère, et donc "A majuscule" et "A minuscule" sont deux objets d’étude différents. — Automatik (discussion) 27 juin 2016 à 22:58 (UTC)

Pour compléter la réponse d’Automatik, le W1 qui représenterait « a » est absolument nécessaire et ne peut pas être d:Q9659 dans la mesure où « a » ne désigne pas uniquement la lettre. Par exemple, en français, cette lettre désigne à la fois une lettre, un pronom personnel et une forme de verbe. Ainsi comme je l’ai dit, les Q désigne des concepts (par exemple Q9659 désigne la lettre « a ») et le Wiktionnaire nécessite forcément une autre lettre pour représenter des « suites de lettres ». Pamputt ^[Discuter] 28 juin 2016 à 05:13 (UTC)

@Automatik il y a le glyphe, le caractère et la lettre. A et a sont bien la même lettre et ont des choses en communs. Il y a de nombreuses informations propres à cette lettre qu’il faudrait améliorer. Si d:Q9659 est sur la lettre (et sur la lettre anglais pour le moment, il faudrait améliorer cela) mais rien n’empêche de créer en plus des éléments Wikidata sur les caractères (voir sur les glyphes), la question à se poser est : a-t-on des informations spécifiques que l’on peut indiquer dans Wikidata sur ces caractères ? (dis autrement : qui a des sources sur le sujet ?).

@Pamputt euh ok… je crois voire ce que tu veux dire mais je ne vois pas si c’est une bonne ou une mauvaise idée. Attendons, surtout que comme je le disais, il y a déjà des milliards de choses à faire en attendant.

Cdlt, VIGNERON * ^discut. 28 juin 2016 à 06:50 (UTC)

C’est vrai que rien n’empêche de créer un entrée Wikidata pour la forme de verbe "a" en français, pour l’article "a" en anglais ou encore pour le caractère a minuscule. Cela dit je ne sais pas si c’est une bonne idée. Prenons l’exemple de l’entrée Wikidata "cheval". Les informations qu’on y trouve parlent de l’animal, alors que du point de vue du lexicographe, le fait que "cheval" désigne un animal n’est qu’une info parmi d’autres, pas l’info principale. Du point de vue lexicographique, sur "cheval", on aimerait connaitre l’étymologie du mot (de cette suite de lettres comme dit Pamputt), sa prononciation, ses flexions… Ce sont des informations qui se démarquent nettement de celles qu’on trouve sur Wikidata, à ma connaissance, simplement parce qu’elles désignent le signifiant, et non le signifié. — Automatik (discussion) 1 juillet 2016 à 00:56 (UTC)

Wikidata est centré sur les concepts. A concept = 1 élément, donc il est impossible à mon avis d'avoir confusion entre le caractère et le pronom personnel. Ou alors dans le cadre d'un élément "ambigu" qui est la réunion de plusieurs concepts, mais dans ce cas les éléments précis doivent (et peuvent) être crées en cas de besoin structurel. TomT0m (discussion) 16 juillet 2016 à 07:53 (UTC)

@TomT0m : je n’ai pas compris ta réponse. La discussion ci-dessus vise justement à dire que Wikidata, en l’état actuel, n’est pas adapté au Wiktionnaire puisque comme tu l’as dit Wikidata traire des concepts tandis que le Wiktionnaire traite des « suites de lettres ». Pamputt ^[Discuter] 18 juillet 2016 à 20:45 (UTC)

@TomT0m :

@Pamputt : Bonjour, je suis nouveau sur le sujet et wikipédia dans son ensemble mais de part mon boulot et mes habitudes, la centralisation de données est mon leitmotiv en informatique et je trouve ce sujet très intéressant (utilisation de wikidata pour le wiktionnaire).

Je pense qu'avec Wikidata il ne faut pas penser "a" comme étant une suite de caractères ayant plusieurs sens mais comme plusieurs sens distincts qui ont la même représentation graphique. En gros, quand un utilisateur demandera la page "a" dans le wiktionnaire, il aura accès (techniquement), non pas à plusieurs sens de "a" mais bien à tous les éléments wikidata ayant la même représentation graphique quelque soit la langue, le genre, l'étymologie... (à charge pour l'outil de visualisation d'agréger et ordonner correctement les informations). En soit Wikidata me semble tout à fait adapté au Wiktionnaire.

Pour ce qui est de l'étymologie (par exemple), il arrive souvent qu'une même suite de caractères présente des étymologies différentes (par évolution convergente comme "somme" qui peut résulter de "sommus", "somna" ou "sagma"). Ce genre de cas sera facilement pris en charge par wikidata puisque chaque élément (somme=addition, somme=sommeil, somme=bât) aura sa propre étymologie, sans risque de confusion possible.

Pour aller plus loin, la représentation graphique, la langue, l'étymologie, le genre, le sens, etc. ne sont que des propriétés d'un concept abstrait qui n'est concrétisé que par ses propriétés. Si deux concepts abstraits ont les mêmes propriétés ce sont les mêmes concepts, s'ils ont des propriétés (ne serait-ce qu'une seule) différentes, alors il s'agit de 2 concepts différents, donc 2 entrées différentes dans Wikidata. La difficulté pour les humains réside (selon moi) dans l'acceptation de cette notion de concept abstrait qui n'a pas de représentation par lui-même hormis un code du genre Q54132, W6543 ou L6578 et que du coup "a" n'est pas un concept.

C'est du moins ma compréhension de ce que j'ai pu lire sur le sujet jusqu'à présent. Jpgibert (discussion) 14 octobre 2016 à 09:57 (UTC)

Merci de ces commentaires, qui devraient bien clarifier les choses. Mais ce n’est pas si simple. Si le sens est une propriété, chaque définition correspondrait à un concept différent ? Cela n’a guère de sens, d’autant plus que la distinction entre sens est souvent assez arbitraire. Pour les verbes, la transitivité est une propriété, mais le même verbe a en général des utilisations transitives et des utilisations intransitives, il faudrait donc au moins deux concepts pour chaque verbe ? La prononciation est une propriété, mais beaucoup de mots ont plusieurs prononciations possibles. L’étymologie est une propriété, mais beaucoup de mots ont plusieurs hypothèses étymologiques concurrentes. Etc. La linguistique ne se prête pas du tout à ce genre de raisonnements. Par ailleurs, certains renseignements que nous donnons ici sont liés à la suite de caractères et à la langue, pas du tout au mot lui-même, je pense aux anagrammes.

Quant à utiliser des codes du genre Q54132, c’est inimaginable pour un contributeur normal. Merci de souligner ce point. Je continue à penser que tout ça n’est acceptable que s’il n’y a aucun impact sur la contribution au projet, mais je ne pense pas que les promoteurs de Wikidata voient les choses de cette façon. Lmaltier (discussion) 14 octobre 2016 à 12:57 (UTC)

On utilise marginalement les numéro Q pour renter des informations dans l'interface. On tape des lettres et les éléménts dont les alias/libellés correspondent nous seront proposés. Sinon pour le wiktionnaire on se dirige vers un concept d'entité "lexeme", distinct des entités "éléments", qui correspond à un "mot", et à chaque lexeme dans une langue on pourra associer un ensemble de définition, qui pourront être des éléments Wikidata en plus des définitions en toutes lettres habituelles. Du coup, comme les éléménts Wikidata ont une définition et une seule par construction, ils ne doivent pas être ambigus - "1 concept = 1 élément", on insistera jamais assez la dessus même si certains Wikipédiens sont un peu réticents vu qu'ils préfèrent avoir des interwikis "facile" traditionnellement et ont tendance à lier des articles à un élément qui correspond pas exactement. Des projets comme d:wd:XLINK ont pour but d'essayer de traîter ces cas. Du coup on va retrouver le traditionnel "1 mot => plusieurs définitions" sous forme de "1 lexeme => plusieurs éléments". Des discussions sont en cours sur d:Wikidata:Wiktionary si vous voulez plus de détails, perso je ne suis pas impliqué là dedans et je suis ça juste de loin. Mais les choses ne sont pas figées, si vous avez des questions elles seront les bienvenues. TomT0m (discussion) 14 octobre 2016 à 16:38 (UTC)

Wikidata + Éditeur Visuel

Ma réflexion sur le thème de l’évolution technique du projet, qui puisse s’appuyer sur une base de données m’a amené à élargir la réflexion et à considérer qu’il est indispensable que cette évolution soit conjointe avec l’évolution de l’interface de modification. Si je ne perçois pas encore très bien les avantages à stocker ce qui est entré ici dans une base de données, je vois comme une priorité que ça ne rende pas la contribution plus compliquée. L’Éditeur Visuel est encore peu performant pour le Wiktionnaire, car il n’a pas été adapté, mais il est conçu pour fonctionner avec des informations en locales et d’autres dans une base de données. Il me semble donc que nous devrions penser les étapes de développement comme des mouvements conjoints, ou pour le dire autrement, que la deuxième étape de développement d’une base de données lexicale ne se fasse pas sans que la première soit pleinement intégrée grâce à l’Éditeur Visuel. Pensé ainsi, le déploiement sera beaucoup plus lent, et impliquera bien plus de personnes à chaque étape, mais il me semble nécessaire d’imposer cette contrainte aux développeurs sous peine de rester dans une "phase transitoire" pendant une durée qui fasse fuir tous les contributeurs. Qu’en pensez-vous Noé 20 juillet 2016 à 11:34 (UTC)

Je suis entièrement d’accord avec ce point de vue. Je pense qu’une grosse partie de nos contributeurs sont contre Wikidata parce que nous avons un retard sur l’aide à la contribution considérable par à rapport à Wikipédia. Y remédier changera ces avis, je pense. — Lyokoï (Parlons

) 20 juillet 2016 à 14:34 (UTC)

Ce que vous entendez par un éditeur visuel est la possibilité de modifier un élément de la page en voyant le reste affiché ? Par exemple, ne modifier que l'étymologie pour un mot donné tout en voyant les définitions proposées ? C'est faisable, je pense.

Cependant, vous aurez certainement un éditeur visuel, mais peut-être pas l'éditeur visuel. Voyez-vous la différence ? L'éditeur visuel est adapté aux pages de plain texte, ce qu en'est pas le Wiktionnaire. Il existe un élément de l'éditeur visuel nommé Parsoid. Celui-ci permet une conversation HTML/wikicode. Il est utilisé sur Flow, par exemple et pourra être utilisé sur des champs de saisie pour des contenus riches (si nécessaire et pertinent).

Bonne journée, Trizek (WMF) (discussion) 20 juillet 2016 à 16:54 (UTC)

Je pense qu’on peut garder l’actuel. Les articles du WT sont en moyenne moins long que ceux de WP, s'il n'y a pas de modif par section, on s’en fiche un peu surtout que les retours de WP sont bons sur la chose. Non, ce qu’il faut en premier lieu, c’est que l’éditeur visuel permette de bien marquer les différentes sections des articles, de créer une structure ex-nihilo à la demande afin que le contributeur n’ai pas à restructurer. Si actuellement on préfère utiliser CréerNouveauMot, c’est parce que notre outil le fait déjà. Il faut que l’éditeur le fasse bien, lui aussi, pour que tous se mettent à l’utiliser.

En ajoutant un pense-bête, un schéma-type ou un prototype facilement accessible en un clique (dans une bulle par exemple), pour guider le lecteur sur la Structure de l’article. Et on a aura un outil très performant. — Lyokoï (Parlons

) 21 juillet 2016 à 09:07 (UTC)

Quelques réflexions :

Plus l’édition est simple, mieux ça vaut, je suis 100 % d’accord. Et elle est actuellement trop compliquée, c’est sûr. Un outil pour cacher cette complexité est une approche, mais qui ne doit pas faire oublier qu'on peut essayer de limiter la complexité d’édition avec l’édition actuelle. J’ai déjà parlé du cercle vicieux : la complexité rebute certains, mais pas ceux qui aiment cette complexité, et ceux-ci ont tendance à l’augmenter encore, ce qui rebute encore plus de monde, etc. C’est une sélection naturelle des contributeurs qui tend vers leur diminution. C’est ce cercle vicieux qu'il faut briser. Au sujet de la simplicité, voir w:en:KISS principle (ou w:Principe KISS si vous ne comprenez pas l’anglais).
Ce qui est entré ici est déjà stocké dans une base de donnée lexicale, basée sur le principe : une suite de caractères (représentant un mot, ou plusieurs mots qui s’écrivent pareil) est associé à une description lexicale (le texte de la page). C’est un principe commun à tous les wikis, et qui a fait leur force. Il faut absolument garder ce principe, qui peut faire gagner beaucoup de temps aux contributeurs, en permettant de faire des copier/coller de pages, y compris à partir de fichiers locaux de son ordinateur. Et c’est toujours plus facile de gérer des zones de texte. Beaucoup de contributeurs préfèrent aussi ça à l’obligation de devoir cliquer à différents endroits pour pouvoir faire ce qu’ils veulent. Restons simples. Voir w:en:KISS principle.
Vouloir faire un lien avec une base de données externes gérant les entités internes de chaque page implique forcément, quoi qu'on fasse, d’introduire des mécanismes pour gérer les liens entre nous et cette nouvelle base de données, et c’est forcément une complication supplémentaire. Voir w:en:KISS principle.
Cela impliquerait aussi, presque inévitablement, moins de flexibilité s’il faut éviter de faire des changements de structure des pages qui rentreraient en conflit avec la structure de Wikidata. Bien sûr, on peut toujours changer une structure de base, mais ça ne se fait pas d’un coup de doigt, et ça prend du temps d’évaluer les conséquences. Moins de flexibilité est une mauvaise chose.
Le principe "un wiki = une langue de rédaction = une langue de discussion, la même que la langue de rédaction" est un principe simple qui a régi tous les wikis de la fondation, sauf ceux liés à l’organisation générale et ceux ne nécessitant pas vraiment de discussion, ou ne nécessitant pas de rédaction. Gardons ce principe simple.
Tout ce que je dis ci-dessus, un projet l’a superbement ignoré malgré mes mises en garde, OmegaWiki. Résultat : une perte de certains contributeurs par les wiktionnaires, et malgré tout un échec complet : il n’y a quasiment plus de contributeurs, et presque plus de contributions, l’important effort qu'ils ont fourni n’a servi à rien. Tenons compte de l’expérience acquise. Voir w:Retour d’expérience, que je cite Il permet de se confronter à la réalité du monde, qui peut différer de ce que les ingénieurs ou concepteurs de services avaient imaginé. Il vaut bien mieux s’appuyer sur ce qui marche : robots aidant à se compléter mutuellement entre versions linguistiques, robots aidant à garantir la cohérence entre versions, et cela toujours sous une supervision humaine, et sans que ça ait de conséquences négatives sur les contributeurs. Lmaltier (discussion) 20 juillet 2016 à 17:24 (UTC)
On a une richesse d'information incroyable, mais elle est inexploitable (à moins d'énormes efforts, je peux en attester). Les robots ne sont pas la solution : il faut actuellement 3 mois si on veut changer ne serait-ce qu'un modèle présent dans toutes les pages, et il faut être calé en programmation pour faire des changements raisonnables. Alors que si on séparait clairement contenu lexical et mise en forme, ce genre de modification se ferait instantanément, ce qui permettrait de focaliser notre travail sur le contenu du site. Tant qu'on n'a pas cette séparation, on restera un dictionnaire de seconde zone. — Dakdada 21 juillet 2016 à 10:30 (UTC)
Pour cela il faut qu'on s’assure au minimum de la qualité des futures structures des articles. Un éditeur visuel au carré nous évitera de perdre du temps sur les nouvelles entrées. Et une fois que nous aurons reformaté les anciennes, ce sera bon. — Lyokoï (Parlons ) 21 juillet 2016 à 11:34 (UTC)
Dans tous les cas, penser le système d'édition conjointement avec le système de formatage de l'information est indispensable. Trizek (WMF) (discussion) 21 juillet 2016 à 11:36 (UTC)
Tout à fait d’accord, et pourtant, ce sont deux équipes de développement différentes et il ne sera peut-être pas si facile de les convaincre de s’intéresser au même moment au Wiktionnaire. D’où mon idée d’en parler ici avant d’aller les voir, pour présenter une feuille de route qui corresponde à ce que nous souhaitons Noé 21 juillet 2016 à 12:31 (UTC)
La stratégie de développement de Wikidata est à présent intégrée à celle de la Fondation. Le plus difficile sera de convaincre que Wikipédia ne doit pas passer en premier... Mais vous avez encore le temps d'y réfléchir. Trizek (WMF) (discussion) 26 juillet 2016 à 08:26 (UTC)

Je n’avais pas vraiment parlé du sujet, mais je trouve qu’un éditeur visuel adapté à nos besoins serait une très bonne chose pour certains contributeurs. Mais surtout sans l’imposer à tous, sinon ce serait une importante perte de contributeurs assurée. L’actuel est plutôt pire que rien du tout, car ce qu'il permet de faire en pratique d’utile ici est faisable aussi simplement en direct sans s’embarrasser de l’interface supplémentaire, et beaucoup de choses sont infaisables (sur Wikipédia, la question est différente). Il faut voir aussi que chaque décision de changement de structure aura des impacts sur l’éditeur visuel… Sur Wikipédia, la simplicité était un principe fondamental, je constate que ça change peu à peu, et c’est un risque énorme. @Darkdadaah : En parlant de robots, je pensais à des robots qui aident à la coordination, par exemple en détectant les incohérences, pas à des robots qui changent les pages. En parlant de flexibilité, je ne parlais pas de changer un modèle dans toutes les pages, je pensais plutôt à, par exemple, ajouter un type de section ou en supprimer un, ce genre de choses. Séparer contenu lexical et mise en forme ? On le fait déjà, presque toujours, en utilisant pour ça des modèles. On peut améliorer les choses, mais sans renier les principes mêmes d’un wiki. Un dictionnaire de seconde zone, alors que nous sommes déjà le plus important dictionnaire au monde ? C’est incroyable de lire ça. Si nous arrivons déjà, au bout d’une douzaine d’années, à concurrencer les dictionnaires Internet les mieux établis, c’est grâce à notre façon de faire. Ceux qui ont eu des approches différentes n’y sont pas arrivés. Je sais que tu as été attiré par OmegaWiki, et que c’est normal que ça puisse paraître séduisant, mais il faut tirer les leçons du passé, pas répéter les erreurs en jouant les apprentis sorciers et en risquant de mettre à mal ce que les autres ont consacré tant d’énergie et de temps à construire. Lmaltier (discussion) 21 juillet 2016 à 17:21 (UTC)

Explicitation d’idées en cours

Je viens de découvrir une idée en cours à propos de Wikidata et des wiktionnaires, idée non explicitée de façon précise ci-dessus (ni ailleurs sur le Wiktionnaire). Je voudrais donc l’expliquer, malgré son flou actuel, pour permettre la discussion. Cette idée est que, quand on édite une page, les différents morceaux (ou bien seulement certains des morceaux) de la page ne soient plus stockés physiquement dans une page texte du Wiktionnaire, mais à différents endroits, sur Wikidata, et que tous les morceaux soit regroupés lors de l’affichage. Et qu’un éditeur visuel faciliterait le processus. Il s’agirait donc de déporter le stockage de données pour permettre à des outils de les exploiter plus facilement et, dans certains cas (évidemment pas les définitions ni les étymologies, puisqu’elles sont écrites en clair dans une langue…), pour permettre de les stocker une seule fois pour utilisation partagée par plusieurs wiktionnaires.

Voici mes premières réactions pour initier la discussion :

il ne faut pas rendre l’utilisation d’un éditeur visuel obligatoire, car d’une part cela empêcherait la création de pages par robot (et l’énorme majorité des pages ont été créées par robot), d’autre part cela perturberait gravement énormément de contributeurs actuels. Mais un éditeur visuel adapté au Wiktionnaire serait utile à certains contributeurs et faciliterait donc la contribution, ce serait donc une excellente chose. Je pense qu'il est possible d’arriver à un consensus là-dessus, même si tout le monde n’en est peut-être pas encore persuadé.
il faut qu’un contributeur ne soit jamais obligé de se préoccuper d’un quelconque lien avec Wikidata (pas de mention d’un id numérique vers Wikidata ou ce genre de chose). Contribuer au Wiktionnaire est déjà trop compliqué, il ne faut pas compliquer encore. Là aussi, je pense qu'il est possible d’arriver à un consensus là-dessus.
il ne faut pas qu'il existe des super-contributeurs (les contributeurs Wikidata) et des sous-contributeurs (les autres).
personne ne doit avoir à utiliser des notions du style "defined expression" sur OmegaWiki ou "URI de concept" sur WIkidata (cf. https://www.wikidata.org/wiki/Wikidata:Data_access/fr#Comment_puis-je_r.C3.A9cup.C3.A9rer_des_donn.C3.A9es_de_Wikidata_.3F qui est vraiment incompréhensible). Ce serait vraiment la fin du projet à brève échéance.
la façon dont les données sont stockées techniquement n’a en soi pas d’importance, en principe. J’ai toujours supposé que chaque page était associée à un enregistrement dans la base MySQL, avec au moins un champ id numérique (probablement), un champ titre de la page et un champ contenu de la page. Mais je ne suis même pas certain de ça, et ça n’a pas d’importance.
l’endroit où c’est stocké (Wikidata ou pas) n’a pas non plus d’importance.
les problèmes commencent à arriver quand on parle de partage entre wiktionnaires : si un contributeur du wiktionnaire tamoul (par exemple) modifie des données utilisées par la page d’un mot (un mot latin ou un mot araméen, par exemple) sur le Wiktionnaire, et qu'on estime que ces données sont fausses, il faut les corriger. S’il y a un désaccord, on risque donc d’aboutir à une guerre d’édition sans pouvoir amorcer une discussion, faute d’une langue de discussion commune. Le principe même d’un wiki veut qu’on collabore tous à un objectif commun et qu’on puisse en discuter constructivement. Sans langue commune, ça ne peut pas marcher. Cf. le récit de la tour de Babel : tant que les contributeurs-constructeurs se comprenaient, ça avançait bien, dès qu’ils ne se sont plus compris, ça a été la fin.
même sans partager physiquement les données, l’idée suppose quand même, à ce que je comprends, qu’il y ait une structure plus ou moins commune des pages, même si la présentation est complètement différente. Or, la structure peut différer selon les versions par langue. Comment discuter de ce qui serait mieux comme structure de stockage sur Wikidata si on n’a pas une langue commune pour cette discussion ? Une solution peut être de mettre tous les genres de renseignements qui sont présents dans au moins une version linguistique. Mais si on veut rajouter un nouveau type de renseignement, on fait comment pour en discuter avec Wikidata ? Il faut pourtant que ça reste possible facilement sans que Wikidata soit une contrainte.
même pour un type de données précis, par exemple les homophones, l’interprétation du sens peut être différente selon les langues. En français, les homophones sont les mots différents qui se prononcent pareil. C’est important de préciser différents, car, en français, les pluriels se prononcent en général comme les singuliers, et on ne cite jamais sots parmi les homophones de sot : on cite seau, sceau, Sceaux... En anglais, par contre, la définition peut être légèrement différente, car les pluriels se prononcent différemment des singuliers, et une prononciation commune peut suffire à faire des homophones si l’orthographe est différente, même si c’est en fait le même mot. De même, la notion de nom propre est globalement la même pour toutes les langues, mais avec des nuances. Un autre exemple est le mot acronyme, acronym en anglais, Akronym en allemand… etc. dont l’idée est voisine partout, mais l’utilisation effective légèrement différente selon les langues. Toutes ces nuances aussi peuvent amener à des guerres d’édition parce que chaque projet veut avoir un affichage correct dans sa langue.
même la notion de mot peut varier selon les langues, les critères d’inclusion peuvent différer (même si tout le monde partage en principe la règle de base tous les mots de toutes les langues. Il se peut aussi que la notion de langue varie. Il ne faudrait surtout pas qu'il nous soit interdit de créer des mots pour le croate parce que certains sur Wikidata décrètent que ce doit être serbo-croate. Je sais que la neutralité de point de vue est un principe non négociable de la Fondation, mais le Wiktionnaire anglophone bafoue malgré tout allègrement ce principe.
il y a déjà des robots qui peuvent partager des renseignements par importation, même si les possibilités sont limitées, et des robots qui exploitent déjà les autres versions même sans rien importer directement. On peut citer un robot anglophone qui crée des pages à partir de traductions (en les donnant comme pages à vérifier), en contrôlant auparavant sur l’autre wiktionnaire (le wiktionnaire de la langue du mot créé) qu'il n’y a pas d’erreur grossière dans la traduction. On pourrait aussi écrire des robots qui détectent les incohérences pour les signaler (sans les corriger), jusqu’à ce qu'il se trouve quelqu’un de compétent pour exploiter ces incohérences apparentes et faire quelque chose s’il y a besoin.
une chose qui serait quand même intéressante, c’est de pouvoir contribuer comme actuellement, mais d’avoir des avertissements à la sauvegarde si la structure est incorrecte (avec les explications et suggestions voulues). Mais ce n’est peut-être pas directement lié au sujet.

Lmaltier (discussion) 21 août 2016 à 14:35 (UTC)

Bonjour Lmaltier et tous,

J'avais bien lu ces commentaires mais je n'y avais pas répondu directement, je le fais maintenant.

Nous ne savons pas encore à quoi ressemblera l'interface d'édition, comment elle va s'intégrer au Wiktionnaire, c'est une partie du projet sur lequel nous allons travailler, en lien avec les communautés. Cependant, je peux d'ores et déjà dire que nous essaierons de rendre l'édition plus simple qu'elle ne l'est aujourd'hui, notamment via une interface visuelle (intégrée ou non à l'EV existant ? je ne sais pas). Nous travaillons actuellement sur un projet d'interface pour les données de Wikidata dans Wikipédia, quand nous aurons un prototype à tester je le partagerai avec vous, cela vous donnera une idée de ce à quoi ça pourrait ressembler. D'autre part, il est évident que les contenus seront toujours modifiables automatiquement, par un robot ou autre. C'est tout l'intérêt des données structurées, être lisibles, interrogeables et modifiables par une machine. Pas d'inquiétude là-dessus donc, même s'il faudra pour les utilisateurs adapter leurs bots et autres scripts à la nouvelle structure.
Dans la même idée de simplicité, nous essaierons de ne pas employer de termes trop techniques, ni de trop montrer "le ventre de la bête". Les identifiants seront visibles à un moment ou un autre, car c'est le seul moyen d'identifier des identités sans privilégier une langue plus qu'une autre, mais les contributeurs n'auront bien sûr pas besoin de connaître les id par coeur : l'interface proposera un champ de recherche pour pouvoir taper un mot, une propriété... dans sa langue.
Concernant la structure des entités, Wikidata proposera une structure complexe et la plus exhaustive possible afin que tout le monde s'y retrouve, mais en fonction des langues, des communautés, certains champs seront remplis et d'autres pas. De plus, une entité remplie exhaustivement dans Wikidata ne sera pas forcément affichée telle quelle dans une version du Wiktionnaire : vous pourrez choisir quelles données vous choisissez d'afficher ou non.
Concernant la langue de travail, c'est un problème dont nous sommes vraiment conscients. Wikidata étant d'ores et déjà un projet multilingue, cela fait longtemps que la communauté essaie de pallier aux cas où des contributeurs n'ont pas de langue commune. L'utilisation de l'anglais est répandue mais n'est pas la solution ultime. Nous essayons au maximum de traduire les règles, pages d'aide, projets. La structure des données, chacune de ses composantes, pourra bien sûr être traduite dans toutes les langues. En ce qui concerne les discussions, c'est évidemment plus complexe. Nous espérons qu'avec l'apport des contributeurs du Wiktionnaire à ceux de Wikidata, nous aurons une masse suffisante pour que des discussions communautaires puissent avoir lieu dans de nombreuses langues. Ainsi, si une discussion émerge entre deux personnes qui n'ont pas de langue commune, les communautés linguistiques respectives de ces personnes pourront apporter de l'aide et trouver une solution.
Merci pour les exemples que tu donnes (homophones, acronymes). Cela fait partie des discussions à avoir entre les différentes communautés, et nous allons tâcher de trouver des solutions. Je vous rassure, les contributeurs de Wikidata sont habitués à traiter de sujets complexes, de subtilités linguistiques ~~et à refaire le monde~~ donc je suis tout à fait confiante quant au fait que nous trouverons des solutions ensemble.
Je note l'info concernant les robots. En effet, le travail d'import, de vérification, pourra aisément être automatisé, ainsi que le fait de trier les informations pour ne remonter aux contributeurs humains que ce qui nécessite leur attention.

Merci beaucoup pour tes remarques constructives, je reste à disposition pour continuer la discussion. A bientôt, Lea Lacroix (WMDE) (discussion) 14 septembre 2016 à 13:19 (UTC)

- Je n’avais pas encore été assez explicite, j’ai l’impression, je précise donc :
  - beaucoup de contributeurs, dont moi, préparent complètement l’article à créer dans un fichier local de leur ordinateur, puis le copient dans la page à créer ; c’est une technique très efficace ; c’est vrai sur Wikipédia, où cette technique permet à certains de créer des pages directement au niveau article de qualité, et c’est vrai aussi sur le Wiktionnaire. Il est donc fondamental que ça reste possible.
    Si on évolue vers des articles structurés, il suffira d'avoir un assistant d'import (=copier-coller le code wiki dans une boîte texte/un script et zou). On aura alors en plus l'avantage d'avoir une vérification de la structure pendant l'import, chose qui n'est pas faite en copiant le code brut à la main comme actuellement (ce qui ajoute un certain nombre d'erreurs parfois difficiles à repérer). — Dakdada 16 septembre 2016 à 09:17 (UTC)
  - pour les robots : il ne faut surtout pas avoir à réécrire de robots à cause de Wikidata ; je crois que le temps nécessaire pour écrire certains gros robots vous échappe totalement.
    Si on a un outil de conversion comme indiqué ci-dessus, il n'y aura aucun changement radical à faire. Et si on a une véritable API pour modifier les pages, on pourra au contraire simplifier ces gros robots. — Dakdada 16 septembre 2016 à 09:17 (UTC)
  - la question de la langue de travail a été une des causes de l’échec d’OmegaWiki, qui avait des idées de base se rapprochant beaucoup de celles de Wikidata ; dire qu'on essaiera de faire au mieux à ce sujet (ce que disait aussi OmegaWiki au début) n’est donc pas une réponse satisfaisante.
    Il faudrait des exemples précis dans Omegawiki ou ce genre de problème était insurmontable pour considérer ce problème comme véritablement bloquant. Pour ma part j'ai toujours considéré que c'était le principe même d'Omegawiki qui ne fonctionnait pas (sans compter que ce n'était pas un projet Wikimedia). — Dakdada 16 septembre 2016 à 09:17 (UTC)
  - répondre sur certains points c’est un problème, il faudra en discuter n’est pas non plus satisfaisant, repousser la discussion plus tard c’est se boucher les yeux, puisque ce que je voudrais, c’est précisément en discuter maintenant ;
    On en discute depuis des années. Il est temps de commencer quelque chose de concret, en améliorant les choses au fur et à mesure : on ne va pas pondre un truc parfait du premier coup. Quitte à ne pas adopter le résultat final si ça ne nous convient pas. On ne risque pas grand-chose. — Dakdada 16 septembre 2016 à 09:17 (UTC)
    Vous en discutez depuis des années ailleurs qu’ici. La pleine prise de conscience de ce projet par la communauté est extrêmement récente. Pour nous c’est nouveau, et c’est en partie le problème, nous n'avons pas été pris en compte par les décisions dès le début. — Lyokoï (Parlons ) 19 septembre 2016 à 21:45 (UTC)
  - le point sur la liste des langues des mots et la neutralité est absolument fondamental : sans garde-fou, il serait très facile à n’importe quel groupe suffisamment motivé ou n’importe quel Etat totalitaire de faire prendre des décisions totalement inacceptables (en prenant parti sur des découpages entre langues polémiques), ce qui est contraire aux règles de la Fondation. Comme je suppose que Wikidata voudra définir une liste complète de langues un jour ou l’autre (il n’y en a pas besoin pour les interwikis, mais c’est une exception), la question se pose à plein.
  - on pourrait très bien dire que Wikidata rend simplement des données disponibles pour tous ceux intéressés, sans qu'il y ait des liens particuliers avec les wiktionnaires, et donc sans impacter du tout leur développement ; ces données disponibles pourraient être importées, d’une façon ou d’une autre, des wiktionnaires existants ; j’ai l’impression que l’avantage de faire ça serait de rendre disponibles des outils de recherche évolués concernant les mots. Mais pour que ce soit réellement utile, il faudrait tout de même, même dans ce cas limité, régler les problèmes que j’ai déjà cités, en attendant ceux qu'on verra ensuite.
- De façon générale, j’ai l’impression qu’on se focalise sur les aspects intellectuellement séduisants à première vue et les aspects techniques, en oubliant les facteurs humains. Lmaltier (discussion) 14 septembre 2016 à 14:48 (UTC)
  J'ai tenté quelques réponses à certaines de tes questions (notamment les robots). — Dakdada 16 septembre 2016 à 09:17 (UTC)

Des nouvelles concernant le projet wikidata-wiktionary

Des nouvelles concernant le projet wikidata<->wiktionaire. Le projet est (re) lancer (cf. mailling list wikidata). J'ai transmis certaines questions et mes interrogations. Dont voici le retour avec mes commentaires entre crochets:

Comment les bases de données wiktionaire et wikidata sont synchronisées?

De nouveau types de donnée entité [entity] seront créer dans wikidata, avec un nouvel id (par exemple L pour lexemes). Un wiktionaire aura la possibilité d'inclure les données de wikidata dans ses pages (tout ou une partie d'une entité, c'est au choix de la communauté). [La réponse est AMA incomplète, d'après ma comprehension du fonctionnement de wikidata <-> wikipedia: Dans le sens wikipedia->wikidata wikidata est alimenté par des contributeur ou des robots en modifiant directement wikidata; dans le sens wikidata -> wikipedia, c'est les contributeurs qui decident quoi faire des données présentes dans wikidata, example inventé «crée la hiérarchie des concepts les plus importants pour un portail» ou «avoir l’étymologie complète d'un mot» (encore un autre exemple inventé). Par contre, une fois la liste integré coté wikipedia, une modification dans wikidata aura une impact dans wikipedia, c'est tout l’intérêt de centraliser une partie de l'info.]

Est-ce que la façon de contribuer à un wiktionaire va changer?

Oui, il y a aura des changements, nous travaillons à rendre l'edition [editing] de wiktionaire plus facile. Des mock-ups vont être réalisés pour recueillir vos avis.

Est ce que les bots pourront toujours éditer un wiktionary?

Oui, nous voulons que les données soit lisible par des machines ainsi qu’éditable. Avec la nouvel structure [de wikidata], les bots pourront modifier les données enregistrées dans Wikidata et les pages wiktionaire.

Est ce qu'un modification dans un wiktionaire A peux casser un wiktionaire B?

Les données à propos des lexemes sera enregistrés dans wikidata et les wiktionaires choisiront ce qui sera afficher et comment. En effet, si une information enregistrée dans wikidata et affichée dans plusieurs wiktionaires est modifié via Wikidata ou l'interface d'un wiktionaire, cela aura une impact sur toutes les pages [de tous les wiki] où cette information est utilisé.

Wikidata est un projet multilingue, nous avons déjà à nous en pré-occuper. Nous espérons qu'avec l'augmentation des éditeurs, trouver une personne avec une langue commune sera plus facile.

Qu'est qu'apporte wikidata aux wiktionaire?

Les données lisibles par les machines va permettre aux utilisateurs de créer de nouveaux outils, utiles pour les éditeurs basés sur les besoins des communautés. En aidant les différentes communautés (Wiktionaires et Wikidata) à travailler ensemble sur le même projet, nous nous attendons à une augmentation du nombre d'édition sur les données lexicographique avec une meilleur relecture et plus généralement une meilleur qualité. Enfin, quand les données seront centralisés et structurés, les données seront plus facilement ré-utilisable par d'autres sites web et d'autres application en offrant une meilleur visibilité sur le travail des bénévols.

Wikidata FAQ

Il y a une FAQ Wikidata, où est ce que je peux traduire cette page? i⋅am⋅amz3 (discussion) 14 septembre 2016 à 13:05 (UTC)

Bonjour, la page FAQ est déjà traduite en français (cf liste des langues en haut de la page), mais si tu souhaites la traduire dans une autre langue, tu peux cliquer sur le lien "traduire cette page" (toujours en haut) et choisir la langue de destination. Lea Lacroix (WMDE) (discussion) 14 septembre 2016 à 13:25 (UTC)

CC0

Wikidata est sous la licence CC0 tandis que le Wiktionnaire est sous licence CC BY-SA. J’ai l’impression que copier les informations à partir du Wiktionnaire vers Wikidata serait enfreindre la condition SA, mêmes conditions. Faudra-t-il alors des contributeurs qui aille créer un contenu nouveau sur Wikidata pour le rendre utilisable, et cela sans piller ce qu’ils lisent sur les Wiktionnaires ? Quelles solutions sont envisagées afin de respecter le droit d’auteur ? Noé 14 septembre 2016 à 15:44 (UTC)

Question annexe : et sur Wikipédia, le problème devrait être le même, non ? Lmaltier (discussion) 14 septembre 2016 à 16:18 (UTC)

Oui tout à fait. C’est a priori un problème juridique mais je crois que tout le monde s’en fout. La majorité du contenu de Wikidata a en effet été importé de différentes Wikipédia. Il y avait eu une discussion au sujet de la licence il y a quelques temps (je suis peut-être passé à côté d’autres discussions). Pamputt ^[Discuter] 14 septembre 2016 à 17:37 (UTC)

Donc, en théorie, selon la loi, il faudrait supprimer le plus gros de Wikidata, les contributeurs de Wikipédia n’ayant pas autorisé la réutilisation de leurs données de cette façon ? Lmaltier (discussion) 15 septembre 2016 à 06:05 (UTC)

C’est comme ça que je le comprends. Dans la discussion mentionnée par Pamputt, il est question d’une base de données de faits. L’intégration de formes graphiques avec la liste des langues dans lesquelles ces graphies sont des mots et la liste des Wiktionnaires qui les définissent, ça reste dans le domaine du fait pour moi, donc admissible dans une base de données. En revanche, le sens des mots, ça demande des sources et un travail intellectuel dont je ne souhaite pas être spolié. De même pour les réseaux sémantiques et d’autres aspects du projet. J’ai l’impression donc que toute l’avancée que l’on a fais en douze ans dans le Wiktionnaire ne va qu’empecher Wikidata d’avoir une partie lexicale. Mais ma réflexion est encore jeune et j’aimerai beaucoup lire davantage sur ce sujet

Noé 15 septembre 2016 à 08:12 (UTC)

Concrètement en dehors de quelques débats ponctuels de ce type, "tout le monde s’en fout". Nouill (discussion) 15 septembre 2016 à 09:59 (UTC)

Pour information, j’ai répondu à la question de Noé (d · c · b) sur d:Wikidata:Bistro#CC0_et_Wiktionnaire, en résumé, cela ne me semble pas du « tout le monde s’en fout » (qui sous-entend notamment que la question n’a pas été débattue) mais plutôt « on est passé à autre chose après avoir étudié la question et conclut que c’était compatible ». Quant au début de phrase « en théorie, selon la loi », on peut écrire à peu près n'importe quoi derrière sans que ce soit vraiment faux (en particulier avec la loi française qui permettrait de fermer le wiktionnaire aussi). Cdlt, VIGNERON * ^discut. 15 septembre 2016 à 16:22 (UTC)

Bonjour à tous,

Notre réponse à cela est plus complexe que tout le monde s'en fout mais est cependant loin d'être parfaite.

Comme cela a été dit plus haut, un certain nombre de données contenues dans le Wiktionnaire sont factuelles et peuvent être admises dans une base de données. Par exemple, le fait de dire que "arbre" est un nom commun. D'autres contenus, en revanche, comme les définitions, les traductions... sont légitimement couverts par la licence CC-By-SA.

Du côté de l'équipe de développement de Wikidata, nous prévoyons de mettre en place la structure pour accueillir tous ces contenus, mais nous n'allons en aucun cas importer directement des contenus, fait un import massif, ou quoi que ce soit. Les contenus et les décisions quant à leur utilisation restent entièrement entre les mains de la communauté. A partir de là, plusieurs solutions sont possibles :

partir d'une base de données vide et commencer de zéro (ce qui est faisable mais dommage, et on perd une partie de l'intérêt du projet)
importer uniquement les contenus des contributeurs qui déclarent être d'accord pour publier leurs contenus en CC0 (on tire donc un trait la grande majorité des contenus créés par des contributeurs qui ne sont plus actifs aujourd'hui)
modifier la licence d'une partie de Wikidata pour la mettre en CC-By-SA (ce qui compliquerait énormément la réutilisation et la compréhension du projet)
mettre en place une décision communautaire pour accorder de façon globale la possibilité d'exporter le contenu d'un Wiktionnaire (ce qui n'est pas non plus une solution parfaite)

Au delà des questionnements purement légaux, je pense qu'il faut se souvenir de deux choses. D'une part, la majorité des personnes et outils réutilisant des données du Wiktionnaire ne mentionnent pas chaque utilisateur (au mieux "source : Wiktionnaire", comme pour Wikipédia). Dans un monde idéal ou tout le monde citerait ses sources parfaitement, on pourrait insister sur la spécificité des licences, mais dans le monde imparfait où nous vivons, je crains que cela n'arrive jamais. D'autre part, l'objectif des projets Wikimedia est de proposer de la connaissance accessible à tous, et on peut se demander s'il vaut mieux restreindre ce partage de connaissances en restant attaché aux précisions concernant les licences, où si notre objectif est de fournir des informations le plus facilement possible pour des utilisateurs.

J'ai conscience que cette réponse ne satisfera pas tout le monde. Nous sommes toujours en train de potasser les informations légales à notre disposition, demander des conseils, et nous restons ouverts à toutes les suggestions. Lea Lacroix (WMDE) (discussion) 16 septembre 2016 à 09:37 (UTC)

Je vous conseille de faire vraiment attention aux données factuelles, puisque recopier en partie importante voir en totalité la liste des mots d'un dictionnaire sous droit est interdit. Sa nomenclature est protégée. Il va falloir faire de grosses recherches juridiques pour naviguer entre droit des bases de données et droits d’auteur. Et pour vos solutions voici mon avis :

Partir d’une base vide et de zéro. Je vous souhaite tout le courage que vous pourrez trouver. Il n’existe actuellement aucune base de données linguistique qui soit capable de représenter une langue, malgré tous les essais fait depuis des décennies par les chercheurs, et vu que beaucoup de vos développeurs ont découvert les premiers problèmes linguistiques de descriptions des langues durant Wikimania 2016, vous avez encore du boulot…
Vu le nombre d’articles générés par bot, vous n’allez pas avoir grand chose, on est d’accord.
Ça, c’est le problème de Wikidata, c’est vous qui voulez intégrer absolument le Wiktionnaire, pas l’inverse.
Je suis complètement contre. Le SA compte beaucoup pour moi, et il est hors de question de partir sur une licence qui permet l’enclosure, à fortiori lorsque le projet est extrêmement simple de réusage et avec un fort intérêt comme le nôtre.

Certes, la situation est imparfaite, mais c’est aussi parce qu’on ne se bat pas avec les gens qui réutilisent nos projets. Il suffirait qu'on ait un département juridique qui vérifierai que les réusages commerciaux correspondent aux licences pour cela change. Pour moi, ce n’est qu'une question de volonté. — Lyokoï (Parlons

) 19 septembre 2016 à 21:40 (UTC)

Expérience avec Wikipédia

Il serait intéressant de voir comment la coopération Wikipédia/Wikidata se passe :

comment ça marche en pratique (je n’en ai absolument aucune idée) ?
quelles sont les réactions des contributeurs ?
est-ce que ça a fait perdre des contributeurs sur Wikipédia parce qu'ils sont partis sur Wikidata ?
est-ce que ça a fait perdre des contributeurs sur Wikipédia parce qu’ils ne supportaient pas Wikidata ?
est-ce que ça a fait gagner des contributeurs à Wikipédia ?

Lmaltier (discussion) 14 septembre 2016 à 16:18 (UTC)

@Lmaltier : j’ai laissé un message sur le bistro de demain. J’espère que nous aurons des retours de Wikipédiens pour répondre à ces questions. Pamputt ^[Discuter] 14 septembre 2016 à 19:54 (UTC)

comment ça marche en pratique (je n’en ai absolument aucune idée) ? de manière unidirectionnel dans le sens wikidata prend et rend rien le but étant de faire de vos données une banque commercialisable
quelles sont les réactions des contributeurs ? guerre ouverte entre les pro et les anti
est-ce que ça a fait perdre des contributeurs sur Wikipédia parce qu'ils sont partis sur Wikidata ? non pas comme cela sont partis écœurés par le lobbysme crée par wikidata
est-ce que ça a fait perdre des contributeurs sur Wikipédia parce qu’ils ne supportaient pas Wikidata ? ci dessus
est-ce que ça a fait gagner des contributeurs à Wikipédia ? peut être mais surement pas des contributeurs serein et ouvert au dialogue

— message non signé de 82.246.104.97 (d · c) du 15 septembre 2016 à 05:43

J’ai l’impression que des données peuvent être modifiées sur Wikidata et se répercuter sur Wikipédia, la remarque ci-dessus n’est donc pas complètement vraie, je pense. Mais ça ne répond pas à ma question : comment ça marche en pratique, de façon détaillée (mode d’emploi) ? C’est ça qui m’intéressait.

En tout cas, les réponses ci-dessus ne sont pas encourageantes. J’avais déjà l’impression très nette que ce genre de tentative pouvait finir par tuer un projet (cf. OmegaWiki), et ces premières réactions vont dans ce sens. Lmaltier (discussion) 15 septembre 2016 à 06:02 (UTC)

Ce n'est pas des réponses sérieuses. En pratique il y a w:fr:Module:Wikidata, appelé directement par des infobox écrites en Lua, ou indirectement sans Lua, pour afficher une donnée présente sur Wikidata quand il n'y en a pas de fournie en paramètre d'infobox dans l'article (ce qui a donc toujours priorité sur Wikidata). Cet affichage est très discuté pour certains champs (comme la profession, par exemple avec "auteur" terme générique non utilisé en français), ou pour la présentation, ou pour l'absence de contrôle suffisant du vandalisme sur Wikidata, ou pour les incohérences avec le texte de l'article (par exemple lieux de naissance différents car Wikidata a utilisé une source et le texte une autre), etc. Tout ceci peut en théorie être réglé par la bonne programmation des modules Lua d'affichage Wikidata (y compris ne pas afficher certaines choses), mais c'est un processus très lent tellement il y a peu de programmeurs Lua, et donc les polémiques subsistent: voir par exemple la discussion en cours de la prise de décision Wikidata. Mais je ne crois pas que ce soit ça qui fasse particulièrement perdre des contributeurs à Wikipédia ou Wikidata plutôt que d'autres phénomènes constants, comme les désaccords entre contributeurs, les difficultés techniques, ou le manque de temps. Oliv0 (discussion) 15 septembre 2016 à 06:53 (UTC)

Bonjour. Le principal manque du projet Wikidata, c'est le but ultime du projet, et cette absence de vision à long terme se répercute sur les relations avec les autres projets. Après toutes ces années, Wikidata se construit comme un gigantesque arbre de données, mais pourquoi faire ? Ce projet a-t-il un but en soi (faire de la datavisualisation, des requêtes en tout genre, cartographier l'intégralité de la vie humaine ou non-humaine dans une base de données unifiée) ou bien vise-t-il à apporter une aide aux autres projets (Wikipédia, Wikisource, Wiktionnaire, Wikispecies, etc.) ? Wikipédia est une encyclopédie. Wikisource est une bibliothèque. Wiktionnaire est un dictionnaire. Est-ce que Wikidata a vocation à apporter quelque chose au lecteur à travers Wikidata même, ou bien à travers les autres projets ? Tant que les contributeurs de Wikidata n'auront pas répondu à cette question de fond, le projet Wikidata restera le cul entre deux chaises et ne pourra pas avancer. --Consulnico (discussion) 15 septembre 2016 à 09:21 (UTC)

Personnellement j'utilise souvent w:Modèle:Wikidata, mais je regrette profondément de ne pas pouvoir le faire sur la version anglophone. De plus, pour l'installer sur Wikilivres et Wikiversité j'ai mis pas mal de temps pour un résultat quelque peu partiel. Maintenant que je suis admin de Wikibooks (en anglais), vais-je avoir le temps de lancer le déploiement de ce système prévu initialement pour un seul wiki, avec les palabres préalables, puis sa traduction ? JackPotte ($♠) 15 septembre 2016 à 09:24 (UTC)

Je suis le projet de loin car j'espère qu'il me permettra de plus facilement contribuer au Wiktionaire dans le futur. Je me permets d'intervenir suite au message de Consulnico pour y apporter des précisions. En effet, le scope de Wikidata est défini : le but est de créer une base de données centralisées non limitée, qui puisse servir aux autres projets tout en permettant d'y faire des requêtes. D'ailleurs d'autres projets externes se servent déjà de Wikidata pour améliorer leurs produits, comme OpenStreetMap ou... PokéonGo ! Lire des pages de Wikidata n'est pas spécialement prévu, mais l'interface permet néanmoins de le faire, tout comme elle permet de petites retouches. Trizek (discussion) 15 septembre 2016 à 09:42 (UTC)

De mon point de vue, l'expérience de wikidata avec wikipédia fr est, pour le moment, franchement mauvaise : tout simplement parce qu'on a mis du wikidata un peu partout, sans trop se soucier de ce que ça pouvait donner. Résultat : un gros désordre, des données incertaines et des problèmes de présentation. Le problème de wikidata vient notamment de son caractère de base de données, de la traduction parfois incertaine de l'anglais, de la mauvaise définition de certaines données. Ca peut être utile pour certaines choses comme les interwikis, mais dès qu'il s'agit de données dont la définition nécessite un minimum de travail humain, c'est une vraie calamité. Je conseille de bien réfléchir à ce que ça peut apporter au wiktionnaire - si ça peut apporter quelque chose, ce qui n'est pas sûr - et surtout de ne rien confier à des bots. Jean-Jacques Georges (discussion) 15 septembre 2016 à 10:41 (UTC)

@Trizek : je pense sincèrement que Wikidata n'apportera pas de facilitation à la contribution du Wiktionnaire. Parce qu’actuellement ce n’est pas l’organisation de la donnée qui est bloquant, mais l’interface de contribution. Nous exigeons que soit adapté l’éditeur visuel avant toute implication de Wikidata dans le projet pour cette raison. — Lyokoï (Parlons

) 15 septembre 2016 à 15:57 (UTC)

Cette intégration de l'éditeur visuel ne se fera pas. Cela sera un autre, lié à l'idée d'une structuration des données (donc, si j'ai bien compris, à Wikibase). À l'heure actuelle, le Wiktionaire est créé à partir d'une page blanche (Word). Le futur sera de compléter (richement) des cases définies (Excel). C'est ce que vous faites déjà en ayant une structuration déjà prédéfinie pour les articles, avec titres formatés, les modèles pour à peu près tout... et qui fait la qualité des informations du Wiktionaire. Trizek (discussion) 15 septembre 2016 à 17:25 (UTC)

--

Je ne partage par l'opinion - que je trouve trop catastrophiste - de certains mais j’appuie totalement et fortement le dernier point de Jean-Jacques Georges. Sur la Wikipédia francophone, l’intégration se passe très bien sauf quand on essaye d’aller trop vite (idem sur les autres projets d’ailleurs, sur la Wikisource francophone, les bandeaux des pages Auteur: peuvent maintenant être générés automatiquement par Wikidata mais cela a pris du temps et plusieurs étapes pour que cela soit fait correctement) ; les projets Wikimédia sont là depuis 15 ans, Wikidata depuis 4 ans et ils sont a priori là pour des dizaines d’années encore, donc il ne faut surtout pas céder à l’urgence. Une bonne idée serait de commencer à comprendre Wikidata et à réutiliser ces données dès maintenant, à voir ce qui est possible et comment ; je pense par exemple à repartir des quelques requêtes SPARQL postées sur la Wikidémie et d’aller plus loin et d’imaginer des cas d’usages concrets. Cdlt, VIGNERON * ^discut. 15 septembre 2016 à 16:03 (UTC)

requêtes SPARQL ? Qui va comprendre ce que ça veut dire, sinon les spécialistes ? Personnellement, j’ai bien compris que Wikidata permettrait de faire des requêtes très puissantes de façon rapide. Mais encore faut-il que ce soit possible de créer cette base de façon correcte (ce qui n’est pas du tout évident, et même mal parti si tous les locuteurs de toutes les langues du monde doivent partager une base unique), et aussi que ça ne tue pas les différents wiktionnaires à petit feu. Lmaltier (discussion) 15 septembre 2016 à 19:50 (UTC)

@Lmaltier : pour illustrer un peu les possibilités de SPARQL pour le Wiktionnaire, j’ai initier une section. Ça demande pas mal de compétence technique mais si on arrive à faire quelque chose, ça pourrait donner des résultats intéressants pour le Wiktionnaire. Pamputt ^[Discuter] 16 septembre 2016 à 05:41 (UTC)

Je n’en doute pas (si c’est possible de le faire bien), c’est ce que je dis. Mais si pour y arriver, il faut faire des choses qui tuent les projets… On pourrait arriver aux mêmes avantages avec un projet Wikidata par langue de travail, donc un spécial pour les francophones, et là, mes objections tomberaient presque toutes. Il ne faut donc pas se baser sur ces avantages pour défendre les idées préliminaires actuelles, il faut simplement essayer de répondre aux arguments contre, d’éliminer les problèmes potentiels graves. Lmaltier (discussion) 16 septembre 2016 à 05:56 (UTC)

Inutile de craindre le mot SPARQL, il est juste là pour distinguer ces requêtes d’autres requêtes (dans le cas de Wikidata, on peut aussi faire des requêtes via l’API par exemple). Si cela te gêne, tu remplaces « SPARQL » par « machin-truc » et tu n’y prêtes pas plus attention. De toute façon, le but n’est absolument pas que les wikidémiciens fassent des requêtes eux-mêmes mais de créer des modèles avec des requêtes pré-construites qui les feront à leur place (quelque chose du style {{Carto|fin|ac}}). Je ne comprends pas tes objections : concrètement, pourrais-tu décrire précisément un problème grave que tu as repéré ? (et pas juste une généralité comme « le multilinguisme c’est mal » alors que depuis 4 ans, la diversité des langues n’a non seulement causé aucun problème qui n’a pas été possible de résoudre mais en plus cela a enrichi les échanges ; d’autant plus que l’on peux parfaitement contribuer à Wikidata en parlant uniquement français). Cdlt, VIGNERON * ^discut. 16 septembre 2016 à 09:32 (UTC)

Je n’ai jamais dit "le multilinguisme c’est mal" (sinon je ne serais pas sur le Wiktionnaire, ni admin sur le wiktionnaire anglophone), mais qu’un wiki a besoin d’un langue de travail commune, même si certains (très particuliers) peuvent faire exception comme Commons, qui n’est pas un wiki classique. Combien de personnes sur Wikidata ne comprennent pas l’anglais, j’aimerais bien le savoir ? Et l’expérience de Omegawiki est frappante, même si ce qui est envisagé est un peu différent. Mais comme ce qui est envisagé n’est jamais explicité, chacun a sa propre vision qui lui semble évidente, je pense, bien que toutes ces visions soient différentes… Lmaltier (discussion) 16 septembre 2016 à 11:34 (UTC)

Désolé pour l’exagération mais tu as compris l’idée. Pourquoi Commons serait une exception et pas Wikidata (il y a pourtant bien plus de textes dans la description d’un fichier Commons que sur un élément Wikiata). Pourquoi vouloir une langue commune globale à Wikidata ? Chaque projet Wikidata traite des éléments qui le concerne dans la langue qu’il souhaite, sur les sous-projets concernant la France, les discussions sont presque toutes en français (de toute façon, les problématiques sont si spécifiques et si liées à la langue que le Français s’impose de lui-même). Je ne sais pas combien il y a exactement de francophones non-anglophones mais 36 contributeurs se sont placés dans la catégorie « user fr » et pas dans « user en » (c’est déclaratif donc pas forcément représentatif) mais je le répète, il n’y a qu’exceptionnellement besoin de parler anglais sur Wikidata (et on peut toujours demander à ce qu’une page d’aide ou une discussion soit traduite en français si ce n’est pas encore le cas). Sur Wikidata cohabitent effectivement des visions différentes (tout comme sur le Wiktionnaire et sur tout les projets Wiki), et là encore je ne vois pas en quoi c’est un problème, chacun cultive son jardin dans la plus parfaite aspiration de l’esprit wiki. Cdlt, VIGNERON * ^discut. 16 septembre 2016 à 14:04 (UTC)

Bien sûr qu’il y a des francophones, ce n’était pas ma question, mais je pense que ce sont tous des francophones à l’aise avec l’anglais. Par ailleurs, on peut vouloir travailler sur des mots d’une langue sans être capable de discuter dans cette langue. Pourquoi vouloir une langue commune à Wikidata ? Si c'est un wiki unique, il y en a évidemment besoin, ne serait-ce que pour discuter de la structure générale et de ses évolutions ; s’il y avait un Wikidata (traitant de toutes les langues) différent selon la langue de travail, ce serait bien sûr différent. Sur Wikidata cohabitent effectivement des visions différentes : mais il y a des limites, et il faut bien comprendre de quoi il s’agit si on veut pouvoir en discuter ici. Je comprends que Vigneron a la vision qu'il n’y aura jamais de phrases (textes étymologiques, définitions, citations, etc.) stockées dans Wikidata, il me semble évident qu’il y a d’autres visions (mais peut-être pas chez les contributeurs Wikidata ????). Tout ça n’est pas clair, et tout le monde doit expliciter ce qu'il a en tête pour qu'on puisse s’y retrouver et donner un avis. Lmaltier (discussion) 16 septembre 2016 à 15:43 (UTC)

Je passe la question des langues que je ne comprends pas vraiment, je le répète tout de même une dernière fois : il n’y a pas de langue globale et cela marche globalement très bien depuis presque 4 ans.

Chacun a sa vision mais il y a des choses qui sont tout de même gravées dans le marbre. La principale est que Wikidata stocke *uniquement* des données, ces données peuvent être de type textuelle mais seulement et seulement si l’on ne peut pas faire autrement (ce qui est rare, actuellement seulement 29 propriétés sur 2719 ; qv. d:Special:ListProperties/monolingualtext). Pour l’étymologie, il me semble que l’on peut facilement faire autrement (voir ce que l'on fait déjà avec d:Property:P138 et un exemple sur d:Q183) ; pour les définitions et les citations là oui, cela pourrait être du texte (à discuter, pour les citations cela pourrait être des éléments).

Cdlt, VIGNERON * ^discut. 16 septembre 2016 à 17:02 (UTC)

Donc, j’avais mal compris, c’est bien la preuve que ce n’est pas clair… J’avais compris qu'il n’y avait pas de problème de licence parce que Wikidata ne stockait pas de textes. Pour l’étymologie, il y a, normalement, des explications textuelles, on ne peut pas faire autrement, sauf dans des cas ultra-simples. Pour les définitions, c’est évident. Si on veut importer des textes provenant des wiktionnaires, l’argument sur l’incompatibilité des licences est donc 100% valable, et il ne sert pas à grand chose de discuter comment faire des choses qu’on n’aura de toute façon pas le droit de faire. Lmaltier (discussion) 16 septembre 2016 à 18:02 (UTC)

Lmaltier (d · c · b) Wikidata ne stocke quasiment jamais de texte. Pour les rares textes, et si on estime que ceux-ci sont suffisamment originaux pour être protégé par le droit d’auteur (ce qui est à prouver, pour tout les textes copier-coller depuis des sources du domaine public là non plus il n’y a pas de problème de compatibilité), alors il y aurait incompatibilité et l’import ne pourra pas se faire mais cela ne concerne qu'éventuellement une petite partie, ce n’est absolument pas bloquant pour la majorité des données et il existe d’autres solutions que l’import ; il ne me semble pas y avoir de problème pour importer l’essentiel du Wiktionnaire automatiquement : la langue, le genre, la nature, le nombre, les dérivées, les déclinaisons, les conjugaisons et tout les formes fléchies, les hyper-hypo-méro-holo-homo-syno-nymes, les traductions, les sources et références, etc. des mots. Pour les étymologies, le Wiktionnaire peut avoir besoin d’utiliser le texte mais pour stocker les données étymologiques dans Wikidata, faire des phrases ne me semble pas nécessaire (et à partir de ces données on peut produire un texte lors de l’éventuelle récupération). De toute façon, tout cela concerne la relation du Wiktionnaire vers Wikidata, il y au moins tout l’autre versant réciproque (Wikidata vers Wiktionnaire) qui lui ne pose pas de problèmes de licence (partie pauvre sur cette page alors que pourtant cela me semble la plus intéressante). Cdlt, VIGNERON * ^discut. 16 septembre 2016 à 18:28 (UTC)

Non, l’essentiel de ce qu'il y a d’utile dans le Wiktionnaire, ce sont des textes. Le texte ne peut absolument pas être éliminé dans les étymologies si on veut que ce soient des étymologies : il ne suffit en général pas de dire de quels mots ça vient, encore faut-il comprendre comment et pourquoi ça s’est produit. Et j’ai déjà dit que les traductions, les listes de dérivés, etc. constituent un travail réel et donc protégé. Il est bien évident que les dictionnaires bilingues du commerce ne sauraient accepter d’être recopiés par Wikidata sous prétexte qu'il ne s’agit que de traductions. C’est pareil ici. Cela montre une méconnaissance énorme de notre travail sur le projet. Il est bien évident aussi qu'on discute surtout de ce qui semble poser le plus de problèmes, mais j’ai vraiment peur aussi dans l’autre sens, des départs de contributeurs qui retrouveraient des renseignements qu'ils ont mis modifiés comme magiquement parce qu’un contributeur tamoul ou tchétchène les aurait changés sur Wikidata, et qu'ils ne seraient pas d’accord, sans pouvoir en discuter. Lmaltier (discussion) 16 septembre 2016 à 19:50 (UTC)

J’interviens juste n coup de vent pour donner mon avis sur les étymologies. En fait je ne crois pas que vos visions soient incompatibles même si ça semble être le cas à première vue. Comme l’a dit VIGNERON Wikidata a pour but de stocker des données lisibles par des ordinateurs donc il est plus que probable que cela soit géré par des relations du style « A (dérive de) B » ou A et B sont des éléments et (dérive de) est une propriété. Après chacun fera ce qu’il veut de cette information stockée de la sorte. Et comme le dit Lmaltier, le Wiktionnaire a besoin de texte pour expliciter au mieux une étymologie donc il est plus que probable que le Wiktionnaire ne reprendra pas tel quel les données provenant de Wikidata. Donc Wikidata disposera de relations lisibles par des ordinateurs tandis que le Wiktionnaire continuera comme il fait actuellement. Pamputt ^[Discuter] 16 septembre 2016 à 23:23 (UTC)

Quelqu'un peut m’expliquer comment wikidata compte stocker précisément des étymologies comme prout et bataclan ? — Lyokoï (Parlons

) 19 septembre 2016 à 20:17 (UTC)

@Lyokoï : De ce que je comprends, Wikidata ne contiendra pas l’ensemble des informations présentes dans les deux articles que tu cites. Au mieux, je pense qu’il donnera « propriété:étymologie -> élément:onomatopée » pour « prout ». Pour « bataclan », ne sera stocké que les liens vers le picard et/ou normand et l’occitan sans donner de détails. Si on veut plus de détails, il faudra venir ici

Ce n’est pas encore fixé, mais je ne vois pas comment on peut faire mieux. Pamputt ^[Discuter] 20 septembre 2016 à 05:35 (UTC)

@Pamputt : Mais à quoi ça sert alors de mettre les étymologies sur Wikidata si on ne peut pas les présenter avec toutes les subtilités qu’elles comportent ? Moi, ça me fait penser aux étymologies de en:wikt qui n’ont aucunes sources et qui sont donc complètement fausses par définition puisqu’on ne peut vérifier l’information. — Lyokoï (Parlons

) 20 septembre 2016 à 10:15 (UTC)

On ne veut probablement pas mettre l'étymologie complète et détaillée sur Wikidata. Par contre, on peut codifier certains aspects de l'étymologie, à savoir lister les étymons directs et la manière dont le nouveau mot est formé. Si on prend comme exemple simple swatting = dérivé de swat + suffixe -ing, on devrait avoir un lien "dérivé de [swatting]" et un lien "suffixé avec [-ing]" (le mot entre parenthèses étant un id correspondant au lexème). Cela permettrait de créer automatiquement : des listes de dérivés, de composés, de mots apparentés (selon un certain degré), mais aussi des choses nouvelles, comme des arbres étymologiques ou des listes de dérivés/mots apparentés entre deux langues. Pour prout ou bataclan, on pourra indiquer onomatopée comme "étymon", avec éventuellement un indicateur "hypothétique".

On peut également penser à ajouter une source/référence pour tous les objets et liens Wikidata, qui permettrait de donner un poids à toutes les informations (et par exemple ne montrer que les éléments d'étymologie constitués d'éléments sourcés). — Dakdada 20 septembre 2016 à 11:35 (UTC)

Le problème, c’est qu'une source n’est pas suffisante. Le mot pâquerette comporte plusieurs origines possible, et je ne parle pas de bréhaigne qu'il faudra que je retravaille depuis que j’ai trouvé d'autres sources. On ne peut se limiter à une source. Dans tous les cas, avec une ou aucune source, Wikidata ne pourra qu’être considéré comme faux par les linguistes sur ce sujet là. — Lyokoï (Parlons

) 20 septembre 2016 à 15:59 (UTC)

WIkidata gère très bien pour le moment la présence de plusieurs sources. Ainsi pour une propriété donnée il peut y avoir plusieurs valeurs (que l’on peut hiérarchiser), chacune d’entre elles ayant une ou plusieurs sources. Les étymologies concurrentes ne posent donc aucun problème à ce niveau là. Tout le problème se situe dans la manière d’avoir des étymologies structurées et je pense que le mieux qu’on puisse faire correspond à ce qu’à décrit Dakdada. Après que ça ne soit pas utilisable par des linguistes, tant pis ; ils se rabattront sur le Wiktionnaire. Wikidata n’a pas vocation a inclure toutes les informations du Wiktionnaire, ni de Wikipédia ni de quelques projets que ce soit. Pamputt ^[Discuter] 20 septembre 2016 à 17:47 (UTC)

J’ai l’impression que tout le monde n’a pas la même opinion. Pour Wikipédia, oui, mais certains semblent vouloir mettre tous les renseignements du Wiktionnaire sur Wikidata, y compris les définitions, pourtant impartageables par nature. Lmaltier (discussion) 21 septembre 2016 à 06:02 (UTC)

Bonjour, personnellement, je contribue à Wikipédia depuis un an environ et je contribue également sur Wikidata. Pour le moment, mon expérience tend à montrer que Wikidata est intéressant mais pas suffisamment intégré à Wikipédia. J'ai eu l'occasion de créer plusieurs articles de manière textuelle et le seul impact que cela a eu sur Wikidata a été de créer un nouvel élément Qxxxx vide. On ne peut pas dire qu'il y ait un gros impact. Sans parler du fait que remplir les éléments Wikidata n'a aucun impact sur les articles Wikipédia si ceux-ci n'intègrent pas de lien via des modèles (ce qui est assez rare).

Pour l'exemple, je suis impliqué dans le nouage et il existe nombre de nœuds dont les codes ABoK sont soit manquant soit incomplets. Je suis donc obligé de parcourir les pages des autres langues (notamment l'anglais) pour récolter les informations, puis les mettre dans Wikidata pour ensuite les retrouver dans Wikipédia (si le modèle est bien exploité ce qui n'est pas toujours le cas).

Je trouve dommage que des informations aussi simples qu'un identifiant ne soit pas automatiquement récupérable dans toutes les langues. Bien sûr, on n'est pas du tout sur une complexité aussi importante qu'une étymologie. A mon avis, l'une des problématiques liées à Wikidata est avant tout (comme cela a été dit plus haut) de comprendre à quoi il est sensé servir et l'objectif poursuivi.

De ce que j'ai pu en lire, pour moi, Wikidata est une source primaire dont le but n'est absolument pas d'être en mesure de générer automatiquement des articles sur Wikipédia ou Wiktionnaire ou autre. Il s'agit d'un ensemble d'informations factuelles simples qui se suffisent à elles-mêmes (autrement dit ne nécessitant pas d'interprétation) éventuellement complétées par une référence et, comme n'importe quelle source primaire, elle nécessite d'être travaillée pour acquérir une valeur encyclopédique ou autre.

Et c'est bien là l'intérêt de Wikidata selon moi : permettre à des projets (Wikimédia ou non) d'accéder à cette gigantesque base de données pour en tirer des informations non pas brutes, mais élaborées. Les cartes géographiques de Vigneron en sont un bel exemple. Les données sont disponibles brutalement dans Wikidata mais peuvent être interprétées pour fournir une information à forte plus-value.

Là où on atteint la limite du système c'est qu'on en vient à créer des travaux originaux basés sur des données primaires, ce qui (à ma connaissance) n'est pas autorisé, du moins sur Wikipédia. Donc pour moi, Wikidata est un outil formidable à ne pas négliger mais qu'il faut utiliser pour ce qu'il est : une base de connaissances primaires simples. Ainsi, mettre dans Wikidata qu'un mot est féminin, oui, expliquer pourquoi ce mot est désuet, non. Jpgibert (discussion) 14 octobre 2016 à 14:28 (UTC)

La structure du Wiktionnaire

« Cette intégration de l'éditeur visuel ne se fera pas. Cela sera un autre, lié à l'idée d'une structuration des données (donc, si j’ai bien compris, à Wikibase). À l'heure actuelle, le Wiktionaire est créé à partir d'une page blanche (Word). Le futur sera de compléter (richement) des cases définies (Excel). C'est ce que vous faites déjà en ayant une structuration déjà prédéfinie pour les articles, avec titres formatés, les modèles pour à peu près tout... et qui fait la qualité des informations du Wiktionaire. » Trizek

En effet, les données du wiktionnaire suivent une structure type avec un code propre qui rend les pages déjà lisible par des machines. Le projet GLAWI l’utilise déjà dans ce sens. Mais on a un besoin URGENT d’une adaptation de l’éditeur visuel qui génèrerai en un clic chacune de nos sections (comme il le fait sur Wikipédia en fait). Parce que :

L’éditeur visuel n’est pas là pour les données (la structure le fait déjà) mais pour les contributeurs. Nombreux sont ceux que le code du Wiktionnaire fait très peur alors qu’ils sont motivés pour contribuer. Si on en a donc besoin, c’est avant tout pour tous ceux qui en ont besoin.
Le travail à faire dessus n’est pas considérable, il faut juste qu’il soit capable de permettre la création d’article selon un format, ce qui n’est pas le cas actuellement (il ne sert qu’à l’intégration de photos pour le moment, wouhou…).
Nous galérons depuis 11 ans maintenant avec nos gadgets dans notre coin pour rendre la contribution plus simple, plus aisée, plus user-frendly. Et lorsqu’on demande l’adaptation de l’éditeur visuel, qui est déjà présent sur le projet, on nous dit que non, cela ne nous servira à rien, merci l’infantilisation…

Je reviendrai argumenter sur « mettre une langue dans une base de données c’est juste la misère totale » plus tard. — Lyokoï (Parlons ) 15 septembre 2016 à 21:20 (UTC)

(J'interviens ici en tant que bénévole.)

Préambule : cette discussion n'a rien à voir avec une base de données ou avec Wikidata. Ce n'est pas parce que je parle de « données structurées » que je parle de base de données ou de Wikidata. La mention de Wikibase tout à l'heure était une erreur d'appréciation, factrice de confusion.

Élément de contexte : seul le Wiktionaire en français propose l'éditeur visuel par défaut.

À l'heure actuelle, le Wiktionaire structure ses données, et pas qu'un peu. Chaque élément a ses modèles, même les titres ont des modèles. Cependant cette structure est loin d'être optimisée pour la lecture par des machines, car elle se base sur du plain-texte avec des balises plus ou moins standard placées entre. C'est un point à certainement améliorer.

Cette structure n'est pas non plus optimisée pour un contributeur lambda : si je ne contribue pas plus, c'est parce qu'il m'est impossible de deviner quel modèle utiliser. Et même si j'utilise un page pré-remplie, il y a tellement de jargon dans le nommage et de champs qu'il faut que j'aille voir la documentation de chaque élément à chaque fois ! Je pense que là dessus, nous nous rejoignons : il faut faire quelque chose de simple et d'adapté à tous.

L'éditeur visuel, présent sur certaines pages semble être la meilleure solution. Ce n'est pas le cas : l'éditeur visuel est fait pour gérer du plain-texte et non pas des données structurées (telles que les discussions ou les définitions). Sachant que le Wiktionaire structure ses données, l'éditeur visuel actuel serait un cautère sur une jambe de bois. Le gain en confort serait minime : édition des éléments textuels, champs renseignées pour les modèles et c'est bien tout. Si je veux ajouter une définition à une entrée, je dois toujours deviner quels modèles utiliser, et où les placer. Je gagne juste une jolie interface et un rendu WYSIWYG. L'éditeur visuel permet de contribuer instantanément à Wikipédia, mais la barrière liée aux modèles qui assurent la structuration sur le Wiktionaire freine énormément l'utilisation de l'éditeur visuel, qui n'est pas adapté.

Il faut ici imaginer une autre solution qui prenne en compte pour de vrai la structuration des données qui fait la force de ce projet. En grossissant fortement le trait, avoir un champ par entrée. Si je reprend Convention:Structure des pages, il faut :

des champs liés à la configuration de la page (le « niveau 1 ») permettant la gestion de {{voir}} (via Wikidata ?), du titre alternatif, les catégories, les interwikis (rebonjour Wikidata)... C'est là aussi que se gère l'affichage des sections, au besoin ;
une « section » par langue permettant de gérer le « niveau 2 ». À la création d'une page, il m'est proposé d'ajouter une langue (c'est toujours possible après) via un simple « ajouter une langue » qui propose les langues. Quand je créé une section pour une langue, j'ai les champs suivants qui sont proposés (les « niveaux 3 »:
1. Étymologie, en champ libre, qui sera édité via un éditeur visuel pour texte riche
2. Type de mot, sous forme de liste déroulante
3. Prononciation (optionnel) sous forme de champ brut. Je n'ai pas les compétences pour juger de la possibilité d'avoir de champ géré par Wikidata, mais c'est un détail.
4. Voir aussi
5. Références (optionnel), pour ajouter des références non gérées par les notes de bas de page
Anagrammes disparaît : il est géré trivialement par MediaWiki.

Là, chacun peut ajouter une nouvelle définition accessible par un lien « ajouter une nouvelle définition » qui proposera :

d'ajouter la définition elle même, dans un champ riche limité aux liens :
d'ajouter un exemple, dans un champ riche qui pourra bénéficier des outils de citation ;
d'ajouter les petites choses qu'il y a au début des définitions et dont j'ignore le nom : « argot », « populaire », « vieilli »... par une liste déroulante ;
d'ajouter une image correspondant précisément à cette définition.

Il n'y a plus besoin de souvenir de l'ordre des sections et chaque champ serait renseigné, l'aide serait au droit de chaque champ. L'édition est à l'avenant : on édite juste le champ dont on a besoin. Pour les débutants, c'est parfait.

De plus, avec une base structurée, il sera possible de citer le Wiktionaire à la définition près, voire au champ près (!), ce que je ne peux pas faire à l'heure actuelle et dont j'aurai parfois bien besoin.

Il est donc possible d'avoir un éditeur visuel riche pour tout cela, permettant de faire de belles pages, mais celui-ci doit être un éditeur de champs pour les raisons déjà exposées

Côté édition « à l'ancienne », il doit être possible d'exporter toute la page dans un tableur pour y faire des modifications « chez soi », ou de télécharger un modèle vide pour y créer des entrées à la pelle. Il faut passer de Word à Excel.

C'est mon opinion sur le sujet. À défaut de bien connaître le Wiktionaire, j'ai au moins une assez bonne connaissance de l'éditeur visuel et de ce qui est faisable ou non. en terme de temps, il faut développer une nouvelle extension, ou en modifier plusieurs. Mieux vaut proposer une structuration proche des besoins des wiktionaristes internationaux et l'implémenter (en gérant les historiques et tout) que de bricoler des bouts de trucs avec un éditeur qui ne prend pas en charge la structuration des données. Il faudra par contre attendre un peu avant d'avoir cela, entre le temps de définition, puis celui de développement et d'implémentation. Il faut se dire qu'avoir attendu 11 ans, c'est un apprentissage de la patience et qu'il faut bien ajouter 2-3 ans avant d'avoir quelque chose de fonctionnel (appréciation personnelle encore une fois, je peux radicalement me planter).

J'espère ne pas avoir oublié de trucs, mais il est possible qu'il y ai des points obscurs sur lesquels je pourrai revenir si vous me les pointez.

Trizek (discussion) 15 septembre 2016 à 22:22 (UTC)

@Trizek :, je vais faire point par point ton argumentation :

Le Wiktionnaire structure ses données, et pas qu'un peu. Oui, Wikipédia fait pareil, nous avons juste une structure plus souvent respectée car nous avons un contenu moins désordonné que Wikipédia. Nous ne définissons que des mots, et il n'y a pas 36 000 façons de le faire. Mais cette structure n’est pas un gros monolithe tout noir car la réalité des mots est multiples et nous avons aussi la souplesse de tordre la présentation lorsqu’on l’estime nécessaire.
Cependant cette structure est loin d'être optimisée pour la lecture par des machines, car elle se base sur du plain-texte avec des balises plus ou moins standard placées entre. Ça c’est ton point de vue. L'outil GLAWI n’a eu que seulement 70 exceptions à gérer au niveau structurel pour fonctionner après le premier parsing. Le fait que la structure soit en plain-texte n’est donc à priori pas gênante. Et pour ce qui est des balises plus ou moins standard, dois-je te rappeler que nous sommes sur un wiki, qu’il sera toujours en construction, que c’est même le principe, et que ce sera exactement la même chose avec des propriétés Wikidata. C’est un point constamment en amélioration.
Cette structure n'est pas non plus optimisée pour un contributeur lambda : si je ne contribue pas plus, c'est parce qu'il m'est impossible de deviner quel modèle utiliser. Et même si j'utilise un page pré-remplie, il y a tellement de jargon dans le nommage et de champs qu'il faut que j'aille voir la documentation de chaque élément à chaque fois ! Ça c’est de la mauvaise foi. Apprendre la structure hyper-redondante du Wiktionnaire ne prend pas plus longtemps que d’apprendre le fonctionnement de Wikipédia. Perso, après deux ans d’ateliers de formation, la plupart des contributeurs que j'ai formé sur les deux projets sont opérationnel sur chacun au bout d’un mois. Il n’y a aucune différence de difficulté avec wikipédia, juste une façon différente de voir les choses.
il faut faire quelque chose de simple et d'adapté à tous. Il l’est déjà en fait, on l’adapte constamment avec nos gadgets, mais ce qu'on veut ce n’est pas adapter la structure du projet à un outil, mais adapter l’outil à la structure actuelle du projet.
L’éditeur visuel n’est pas adapté blablabla… Bon, si on demande de l’adapter, c’est un peu parce qu’il ne l’est pas, hein ? (A moins que ce soit Ars’ qui veuille faire des saucisses avec) Une adaptation extrêmement simple que l’on peut facilement envisager, c’est l’apparition d'un menu proposant de mettre les sections des articles. Avec une info-bulle rappelant la structure en gros. Loin d’être incroyable à faire et à imaginer, les gens cliqueraient sur la ligne qu’ils voudraient mettre et PAF! Une section préformatée qui ne demande qu’un remplissage. Franchement, ce n’est pas la mer à boire. Quand aux modèles, c’est encore un faux problème. Seuls ceux en ligne de définition ne peuvent être inventés, mais il suffirait de mettre un bouton : ajouter un qualificatif à la définition (en plus court) pour que les gens puissent ensuite avoir une liste de ce qu'ils veulent mettre. En fait, ce serait bien que tu nous demandes comment on voit la chose, on y réfléchit depuis un bail…

Passons à l’analyse de ta structure, dis-moi si j’ai faux, mais de ce que je comprend tu voudrais que le Wiktionnaire ne soit qu’une interface de remplissage de Wikidata si j’ai bien compris.

Pour l’éditeur en champ, je viens de te montrer que ce n’était pas nécessaire. Quant aux informations générées par media-wiki (anagramme, prononciation, etc…), oublie s’il te plait. Certes, générer des anagrammes est d’une simplicité sans nom qui devrait remplir bon nombre de champs, mais gérer les anagrammes avec uniquement ce qu’on a dans la base n’est pas possible. Prend anticonstitutionnellement ou vitesse de la lumière, il est impossible de ne limiter qu’aux machines ces informations qui doivent pouvoir être remplie en plain-texte s’il le faut. Bon, je parlerai pas de la prononciation, mais sache que plus bordélique à gérer c’est dur à trouver.

Sinon, la modification, champ par champ, on fait déjà… C’est le modèle {{S}} qui gère ça et qui rend chacune de nos sections et sous-section modifiable. Et si on veut vérifier que chacune des sections est a sa place, rien de plus facile avec un javascript… Un joli bouton : vérifier mes sections et on sait où doit aller quoi…

Pour finir, je conclurais par :

Vu que les données du wiktionnaire s’auto-structure et qu’on pas besoin de changer ça pour les machines ni les humains
Vu qu’il est possible de d’adapter seulement l’interface de l’éditeur visuel avec d’autres boutons pour que ça marche
Vu que Wikidata n’est pas nécessaire pour ce changement
Vu qu’il suffit qu’on pose la question aux contributeurs pour voir qu’ils savent ce qu’ils veulent

Pourquoi ne pas lancer une discussion rapidement pour que ces 2-3 ans de travaux ne commencent pas maintenant ? — Lyokoï (Parlons

) 19 septembre 2016 à 21:23 (UTC)

@Lyokoï : je suis d’accord avec la majorité de tes arguments. Mais pour me faire l’avocat du diable, le principal problème n’est pas d’adapter l’EV au Wiktionnaire mais à l’ensemble des Wiktionnaires étant donné que nous ne structurons pas nos données comme le Wiktionnaire anglophone, hispanophone, etc. Je n’ai pas regarder en détail mais il doit exister une gestion différente sur chaque Wiktionnaire. C’est ça qui va prendre beaucoup de temps. Pamputt ^[Discuter] 20 septembre 2016 à 05:38 (UTC)

@Pamputt : Toutes les wikipédias ont-elle identiquement le même éditeur visuel ? — Lyokoï (Parlons

) 20 septembre 2016 à 09:33 (UTC)

Hormis le fait que je n'ai pas dit que je souhaitais remplir Wikidata avec mon idée, Lyokoï, globalement tu réponds assez bien à mes questionnements. Je reste sur mes positions cependant : je pense que le wiki sous sa forme actuelle peu adapté et qu'un système permettant de mieux structurer les données vous permettrait d'avoir d'avantage de contributeurs occasionnels (hors formation) : un coup d'œil aux RC montre qu'il y a proportionnellement assez peu d'IP qui contribuent par rapport au nombre d'utilisateur enregistrés actifs. Ta proposition de modification de l'éditeur visuel ne serait qu'un éditeur de seconde zone, obligeant à créer la structure sur chaque article au lieu d'en présenter une, ou à chercher quel élément utiliser pour créer tel ou tel éléments. Je maintiens qu'il vaut mieux faire quelque chose d'adapté plutôt que d'essayer d'utiliser un tractopelle pour repeindre une porte.

Mais c'est Pamputt qui a la meilleure conclusion : s'il doit y avoir un outil, il faudra qu'il soit disponible sur tous les Wiktionaires sans cas particuliers. L'éditeur visuel est unique et universel, et il n'y aura rien de fait à la carte. Trizek (discussion) 20 septembre 2016 à 09:41 (UTC)

Mais c’est bien joli tout ça, mais tu n’as pas d’argument en faveur de ce que tu dis, à aucun moment tu ne démontres, preuves à l’appui (donc sans sentiments personnels ni expériences non-abouties) :

que la structure du Wiktionnaire est mal adaptée
que la changer ferait venir des gens
que c’est la cause du peu d’IP contribuant ici.

Tu peux rester camper sur tes positions, mais moi je ne vois aucune raison de te croire parce que :

des réusages simples de la BDD du WT, on en a plein, ce qui prouve que la structure n’est pas moins adaptée qu'une autre.
nous avons fait évoluer le modèle de création de traduction qui n’est qu'une simple interface de remplissage des traductions et le nombre de contributions d’IP sur ce sujet a explosé !
La phrase d’avant nous montre que c’est surtout l’interface qu’il faut améliorer.

Mon éditeur de seconde zone ne fait que singer ce qu’il y a déjà sur WP… Là-bas non plus on ne peut pas générer la structure d’un article d’un coup, il faut aussi ajouter sections par sections. Même si elles sont variables entre les différents WT, nous avons nos sections les plus importantes en commun. Aller chercher une liste des sections quaternaires propre à chaque WT, c’est vraiment trivial et ce n’est pas du bulldozing. Comme quoi on peut proposer un éditeur commun à tous les WT tout en allant chercher les particularités de chacun. — Lyokoï (Parlons

) 20 septembre 2016 à 10:10 (UTC)

Bonjour à tous,

Pour ajouter quelques infos sur ce que peut faire l'équipe de développement de Wikidata :

Actuellement, nous travaillons sur une meilleure intégration des données de Wikidata dans Wikipédia, pour rendre plus simple l'édition de données de Wikidata directement depuis Wikipédia (ce qui est une demande de la communauté depuis longtemps).

Nous avons une étudiante en communication numérique (traduction inexacte) qui travaille dessus depuis plusieurs mois. Je peux pour l'instant vous montrer des maquettes du projet, et d'ici quelques semaines nous aurons un prototype testable. Vous pouvez consulter ici son mémoire de stage, comme tout mémoire c'est un peu verbeux, et en anglais en plus ;), je vous invite à sauter directement à la page 33 pour voir les premières maquettes.

En travaillant sur le projet d'intégration de données lexicographiques dans Wikidata, nous pourrons aussi proposer, de la même manière, une interface d'édition plus simple pour le Wiktionnaire. Comme pour le reste, nous allons tâcher de le construire avec vous, en fonction de vos besoins. Nous avons également bien en tête le fait que nombre d'entre vous contribuent actuellement via des fichiers externes, et ce mode de contribution sera toujours possible. D'ailleurs, dans le but de mieux comprendre votre façon de travailler, j'ai posté des questions dans une section séparée ci-dessous.

Je préfère prévenir cependant que l'arrivée de l'interface visuelle ne sera pas pour demain ni après demain, il y a un sacré boulot de conception et de développement derrière tout ça :) Lea Lacroix (WMDE) (discussion) 16 septembre 2016 à 08:22 (UTC)

@Lyokoï Pour le recordage, Ars’ n’a aucune intention de faire des saucisses avec autre chose que de la viande de porc, comme il est de mise sur le barbecue --Ars’ 20 septembre 2016 à 19:43 (UTC)

Processus de travail : comment créez-vous une nouvelle entrée sur le Wiktionnaire ?

Bonjour,

Suite à la remarque de Lmaltier concernant l'ajout de nouvelles pages en travaillant en amont dans un fichier Word, j'aimerais en savoir plus afin de comprendre comment vous travaillez au quotidien.

Pouvez-vous m'en dire un peu plus sur vos habitudes pour créer une nouvelle entrée ?

Si vous travaillez à partir d'un ou plusieurs fichier(s) externe(s) :
- A quoi ressemble-t-il ? S'il y en a plusieurs, quelles sont les différences ?
- Comment est-il structuré ?
- Quelles modifications faites-vous à sa structure ?
- Quel logiciel utilisez-vous ?
- Comment transférez-vous le contenu dans le Wiktionnaire (copier-coller, autre ?)
Si vous travaillez d'une autre façon :
- Quels outils utilisez-vous ?
- Quelles sont les différentes étapes de votre processus pour créer une nouvelle page ?
Plus généralement :
- Quels sont les problèmes que vous rencontrez lors de ce processus ?
- Qu'est-ce qui pourrait être améliorer ?

Merci d'avance pour vos réponses :) Lea Lacroix (WMDE) (discussion) 16 septembre 2016 à 08:32 (UTC)

En attendant que quelqu'un fasse une réponse plus détaillée, je peux indiquer que certains utilisent le très utile outil de création automatique de nouvelle page décrit dans Aide:Gadget-CreerNouveauMot. — Dakdada 16 septembre 2016 à 09:52 (UTC)

Je n’ai jamais parlé de fichier Word, mais de fichier local à mon ordinateur. Il s’agit bien évidemment de fichiers texte bruts, en général obtenus en partant d’une base utilisée pour un autre article, avec le même format que les pages. J’utilise le logiciel Notepad++, mais peu importe, et je copie/colle. Je répète que c’est extrêmement efficace, et que ça permet même de préparer des tas de pages (dans le même fichier ou dans plusieurs, peu importe), même quand on n’a pas accès à Internet. Sur Wikipédia aussi, cette technique est utilisée. Lmaltier (discussion) 16 septembre 2016 à 11:20 (UTC)

Oups, autant pour moi, non seulement j'ai généralisé mais en plus j'ai utilisé un nom de logiciel propriétaire :D

Merci pour vos retours. Lea Lacroix (WMDE) (discussion) 16 septembre 2016 à 12:42 (UTC)

J'ajoute qu'on fait aussi des imports massifs de ce genre de fichiers via py-wikipedia. — Lyokoï (Parlons

) 16 septembre 2016 à 12:45 (UTC)

Donc pour résumer (corrigez-moi si je me trompe !), soit on écrit/copie-colle un article directement dans l'éditeur d'une page, soit on part d'un fichier avec un contenu de ce genre-là :

'''Foo'''
STARTPAGE
== {{langue|fr}} ==
...
ENDPAGE

et on importe les pages à créer (ici la page Foo) avec Pywikipedia (script pagefromfile.py).

python pwb.py pagefromfile -file:foobar.txt -begin:STARTPAGE -end:ENDPAGE -notitle

Le plus gros du travail est la préparation du contenu des pages. Il s'agit de la structure wiki décrite dans Convention:Structure des pages. Les plus aguerris peuvent écrire le texte brut à la main, mais il est courant de partir d'un modèle (copie d'une page existante par exemple) et de le remplir à force de copier-coller ou à l'aide d'un script. C'est ainsi que des milliers/millions de pages ont été créées par bot (par exemple la quasi-totalité des pages de flexion). — Dakdada 16 septembre 2016 à 14:49 (UTC)

Personnellement, je n’ai rien du genre STARTPAGE et ENDPAGE car je n’utilise pas pagefromfile. Je me contente de copier à la main du fichier vers la page à créer quand il s’agit d’un texte construit manuellement à partir d’une base modifiée. Quant aux flexions, le robot construit directement la page de toutes pièces, car il connait le format voulu, puis la crée directement sur le site (sauf si elle existe déjà pour une autre raison : dans ce cas le robot l’écrit dans un fichier et je la copie, souvent beaucoup plus tard, et à la main, à l’endroit voulu, en adaptant si besoin est). Lmaltier (discussion) 16 septembre 2016 à 15:08 (UTC)

Le principe demeure similaire. Quel "robot" utilises-tu pour créer les pages ? Pywikipedia, ou un script perso ? — Dakdada 16 septembre 2016 à 15:17 (UTC)

Des scripts perso, mais écrits en utilisant le patron proposé par Pywikipedia pour créer des scripts. Pour un exemple, voir Utilisateur:LmaltierBot/fr1er.py (il y en a plein d’autres stockés au même endroit, pour les conjugaisons des verbes français, espagnols, italiens et portugais). Lmaltier (discussion) 16 septembre 2016 à 15:25 (UTC)

Pour info, c’est exactement ce que j’utilise Darkdadaah. Une description détaillée est présentée ici. Pamputt ^[Discuter] 16 septembre 2016 à 16:34 (UTC)

Merci pour vos réponses et liens ! Lea Lacroix (WMDE) (discussion) 20 septembre 2016 à 10:03 (UTC)

Évolution de nombre de contributeurs sur Wikidata et les autres projets

Bonjour. Lmaltier, entre autres, avait posé la question de savoir comment avait évolué le nombre de contributeurs sur Wikipédia depuis l’arrivée de Wikidata. Autrement dit, est ce que Wikidata a pris des contributeurs à Wikipédia ou est ce que les contributeurs de Wikidata sont nouveaux. Denny a apporté une réponse à ces questions 'ici. Après son accord, je traduirai sa réponse pour qu’elle soit accessible au plus grand nombre. Pamputt ^[Discuter] 10 novembre 2016 à 06:55 (UTC)

Ce n’est qu’une petite partie de la réponse. Ma question était iée à l’idée que l’arrivée de Wikidata dans Wikipédia avait pu faire diminuer le nombre de contributeurs de Wikipédia, peut-être parce que certains avaient rejoint Wikidata (mais ce n’est pas l’essentiel), mais surtout parce que certains ne supportaient pas cette arrivée de Wikidata et ses conséquences sur le travail dans Wikipédia. Lmaltier (discussion) 10 novembre 2016 à 07:04 (UTC)

Je crois qu’une partie de la réponse, sinon toute, est quand même présente dans sa réponse. Pamputt ^[Discuter] 10 novembre 2016 à 07:10 (UTC)

Voici donc le message original et la traduction que je propose. Pamputt ^[Discuter] 10 novembre 2016 à 18:23 (UTC)

Message original

We did some analysis back for Wikimania '13 or '14 IIRC (Lydia might remember better). Back then the Wikidata community was about half the size it is today (it has been growing pretty consistently, and still continue to grow - see [1] and [2]. Back then we saw that about half of Wikidata contributors where new, i.e. have not been Wikimedians before that. I would expect that the proportion of new editors, who have not been Wikimedians before, has since then further increased (if there was an effect of contributors moving from Wikipedia to Wikidata, this would be expected in the early days, not later on).

We found no evidence of cannibalization of Wikipedia communities by Wikidata. There was a very measurable effect of decreasing number of edits and size of certain Wikipedias, in particular for the smaller projects - but this was mostly due to the end of the the many edits that were needed to maintain the interwiki system. This can be actually very nicely seen in this chart: [3]. There is this explosion of edits in one month of 2013, which was the removal of many of the interwiki links, and after that the edit rate has decreased visibly compared to before.

I hope that answers your questions. In general it shows that Wikidata was capable of creating its own community, and was not a threat to the existing Wikipedia communities. In fact, it relieved them of certain tasks (in paritcular interwiki link maintenance) and thus allowed the existing contributors in the Wikipedias to be more effective and pursue higher-value goals. I very much expect a similar development for the Wiktionary projects. --Denny (discussion) 01:38, 10 November 2016 (UTC)

Nous avons fait quelques analyses pour Wikimania ’13 et ’14 IIRC (Lydia se rappelle peut-être mieux). À l’époque, la communauté Wikidata était à peu près la moitié de sa taille d’aujourd'hui (elle a grandi à peu près de manière constante, et continue toujours de grandir - voir [4] et [5]. Nous avions vu qu’environ la moitié des contributeurs à Wikidata étaient nouveaux, c’est-à-dire qu’ils n’avaient pas été Wikimédien auparavant. Je m’attends à ce que la proportion de nouveaux contributeurs, qui n’ont pas été Wikimédien auparavant, a depuis lors encore augmenté (si il y avait eu un effet de contributeurs se déplaçant de Wikipédia vers Wikidata, ça aurait du avoir lieu dans les premiers jours, pas après).

Nous n’avons trouvé aucune preuve de cannibalisation des communautés Wikipédia par Wikidata. Il y a eu un effet très mesurable d’un nombre décroissant de modifications et de la taille de certaines Wikipédias, en particulier pour les plus petits projets - mais c’était principalement du à la fin de plusieurs modifications qui étaient nécessaire au maintien du système interwiki. Ça peut en fait être clairement vu sur ce graphique : [6]. Il y a cette explosion du nombre de modifications en un mois en 2013, ce qui correspond au retrait de beaucoup de liens interwiki, et après cela le taux de modification a décru significativement comparé à auparavant.

J’espère que cela répond à tes questions. En général, ça montre que Wikidata était capable de créer sa propre communauté, et qu’il n’était pas une menace pour les communautés Wikipédia existantes. En fait, il les soulage de certaines tâches (en particulier la maintenance des liens interwiki) et permet ainsi aux contributeurs existants dans les Wikipédia d’être plus efficace et de s’attaquer à des objectifs de plus haut niveau. Je m’attends vraiment à un développement similaire pour les projets Wiktionnaire. Denny (discussion) 01:38, 10 November 2016 (UTC)

Changement involontaire

Je signale la discussion suivante sur Wikipédia : w:Wikipédia:Le_Bistro/11_novembre_2016#Wikidata qui montre les problèmes que ça pose quand une modification sur un projet a des conséquences importantes sur un autre projet : on se sent impuissant. C'est ça qui me faisait poser la question sur l'évolution des contributions à Wikipédia. Les contributeurs de Wikipédia sont là pour Wikipédia, pas pour Wikidata, et de même, les contributeurs du Wiktionnaire sont là pour le Wiktionnaire, pas pour Wikidata. Je répète donc une question importante : est-ce qu'il est envisagé que ce genre de chose puisse se passer sur le Wiktionnaire ? Quelle garantie peut(on avoir que ça ne se passera pas ? Lmaltier (discussion) 11 novembre 2016 à 19:20 (UTC)

La réponse est que Wikidata n’impose rien du tout. Si le Wiktionnaire francophone souhaite utiliser certaines données provenant de Wikidata alors ça signifiera que tout changement effectué sur Wikidata sera automatiquement répercuté sur le Wiktionnaire. Mais si la communauté ne veut rien utiliser de Wikidata alors rien ne changera. Les éléments que l’on souhaitera récupérer depuis Wikidata seront à discuter un par un (étymologie, définition, synonyme, traduction, prononciation API, prononciation audio, …). Bien sûr suivant ce que l’on accepte de récupérer depuis Wikidata peut avoir des implications plus ou moins forte pour le WIktionnaire. Pamputt ^[Discuter] 11 novembre 2016 à 19:30 (UTC)

D'après ce que je crois comprendre, la réponse est oui, ça peut se passer sur le Wiktionnaire, s'il accepte de faire confiance à ce que fait Wikidata ? Mais ce n'est pas rassurant, puisque Wikipédia a fait confiance, et que les conséquences sont parfois néfastes : les effets des changements de Wikidata étant démultipliés, ça fait une très bonne cible pour ceux qui veulent propager leurs opinions ou de fausses informations, et cela de façon idéale, de façon très discrète, puisque leurs modifications n'apparaissent pas sur les modifications récentes de Wikipédia et qu'elles ne sont donc pas patrouillées (j'imagine). Lmaltier (discussion) 11 novembre 2016 à 20:14 (UTC)

En fait c’est un peu plus subtile que ça. Sur Wikipédia, ils ont décidé de récupérer les informations en provenance de Wikidata pour certaines infobox (les infobox « biographie »). Depuis peu il a été décidé que quiconque ajoute une infobox biographie doit s’assurer que son contenu (qui contient des infos de Wikidata) est cohérent avec ce qui est dans le corps du texte. Ensuite pour suivre l’évolution, on est averti dans notre liste de suivi par tout changement relatif à un élément associé à un article que l’on suit (si tu veux que je détaille ce point, je peux le faire mais comme c’est un peu technique, je laisse tomber pour le moment). Le seul problème c’est que ce suivi est pour le moment trop verbeux. Du coup on se retrouve avec trop d’informations ce qui peut faire que l’information utile est perdue au milieu dans grand bazar. En ce qui concerne les modifications récentes, il est possible de suivre les modifications faites sur Wikidata en activant la case adéquate. Bon finalement, je ne sais pas si des études quantitatives ont été effectuées mais à mn avis, le nombre de contributions bénéfiques et bien supérieures au nombre de contributions négatives. Et la force (théorique) de Wikidata c’est qu’un bien plus grand nombre de personnes peuvent détecter un éventuel vandalisme. Pamputt ^[Discuter] 11 novembre 2016 à 21:39 (UTC)

Mais une seule contribution négative peut décourager un contributeur parce qu’il se sent impuissant. Il ne faut jamais négliger ce facteur humain. Et si on trouve une erreur comme ça, comment on prévient Wikidata ? Lmaltier (discussion) 11 novembre 2016 à 21:44 (UTC)

Prenons l’exemple de Wikipédia. Il y a plusieurs façon de rapporter l’erreur. Certains contributeurs qui ne connaissent pas Wikidata et n’ont pas envie d’aller voir là-bas signale simplement l’erreur sur le bistrot ou bien la page de projet Wikidata (sur Wikipédia). En faisant ainsi des contributeurs qui connaissent Wikidata peuvent corriger eux-mêmes. Sinon, si le problème vient d’un article particulier et que l’on est pas « hostile » à Wikidata, il y a un lien vers l’élément Wikidata qui correspond à l’article dans le menu de gauche (au-dessus des liens interwikis). Il suffit alors de trouver quelle déclaration est fautive et de la corriger nous-même. On peut aussi rapporter l’erreur sur le bistrot de Wikidata (en français ou dans une autre langue). Pamputt ^[Discuter] 11 novembre 2016 à 22:02 (UTC)

Cela complique donc les choses, et cela peut décourager des contributeurs. Pour que quelque chose marche de façon efficace, il faut respecter le principe KISS : rester simple. Je comprends que beaucoup aient tendance à compliquer les choses encore et toujours, en pensant avoir de bons arguments, mais c'est au détriment du projet. Lmaltier (discussion) 11 novembre 2016 à 22:10 (UTC)

Pour le moment c’est exact. Mais si on arrive à obtenir des développeurs une sorte d’éditeur visuel qui modifie directement les données de Wikidata tout en restant dans le Wiktionnaire, les choses seraient différentes (voir la discussion plus haut en rapport avec celle qu’on avait eu lors de la Wikiconvention). Mais c’est clair que ce n’est pas pour tout de suite. Pamputt ^[Discuter] 12 novembre 2016 à 07:44 (UTC)

Cela ne concernerait donc pas ceux qui préfèrent éditer le wikicode directement, pour être plus efficaces ? Lmaltier (discussion) 12 novembre 2016 à 14:12 (UTC)

A priori oui mais encore une fois, cet éditeur visuel n’est pas près d’être développé à mon avis. Pamputt ^[Discuter] 12 novembre 2016 à 16:21 (UTC)

Cette discussion a comme un je ne sais quoi de déjà-vu. On dirait que certains essayent de nous refaire la même chose que ce qui s'est passé sur Wikipédia avec l'introduction de Wikidata - trait pour trait. Avec les mêmes débats de circonstances sur le bistro de wp pour remettre des sous dans la machine dans cette discussion, en reprenant l'argument sur les départs de contributeurs qui n'étaient d'ailleurs pas partis ... C'est triste. Et lassant. TomT0m (discussion) 12 novembre 2016 à 17:28 (UTC)

@TomT0m : Désolé d’être une autre communauté que celle de Wikipédia. J'ajouterai que si la même discussion a lieu ici, c’est que :

Vous n’avez toujours pas de réponses satisfaisantes pour WP, il est donc normal que cela ressurgisse ici.
Vous n’avez pas suffisamment communiqué chez nous sur ce que vous vouliez faire pour que l’on vous comprenne et donc qu'on zappe la question.

De plus, j'ajouterai que tu sembles considérer que notre projet est le même que WP, et ça, ça nous posera toujours problème dans nos rapports et encore plus dans votre façon de faire l’intégration… Merci donc de faire évoluer le débat. — Lyokoï (Discutons

) 12 novembre 2016 à 17:37 (UTC)

Oh mais moi je veux rien faire de particulier ici, tu te trompes d'interlocuteur. Je suis ici parce qu'on m'a notifié il y a quelques temps. TomT0m (discussion) 12 novembre 2016 à 17:47 (UTC)

Le parallèle avec Commons est intéressant. Dans le Wiktionnaire, il y a de nombreuses images et celles-ci peuvent être modifiées sur Commons sans que nous en soyons notifiés sur le Wiktionnaire, et finalement l’affichage dans le Wiktionnaire sera modifié. C’est un problème car il n’y a pas suffisamment d’admins sur Commons pour réverter un tel vandalisme. C’est très différent pour Wikidata car il y a bien plus de surveillance que sur Commons…et que sur les différents Wiktionnaires. Ce ne sont pas les mêmes admins qu’ici mais il y a toute une escouade de vérificateurs là-bas qui s’ajouteront aux forces des différents Wiktionnaires. Comme l’a écrit Pamputt, chaque Wiktionnaire peut reprendre ce qu’il souhaite de Wikidata, et plutôt qu’un refus de réutilisation, il faudra formuler les limitations que nous souhaitons afin d’orienter le développement du projet. Si nous indiquons que nous ne reprendrons les données que s’il est possible de les modifier dans l’Éditeur Visuel sans que le contributeur ne s’aperçoive de l’endroit où sont stockées les données, alors des efforts seront peut-être fait pour le développement de l’outil servant à modifier les données ici. Pour cela, il faut se faire entendre, ce qui me semble tout à fait faisable en ce moment, grâce à la présence et à la volonté de Léa et des autres membres du projet qui répondent très rapidement aux questions et suggestions Noé 17 novembre 2016 à 08:35 (UTC)

Avantages pour les contributeurs - duplication de l’information

J’ai récemment posé quelques questions aux développeurs sur Wikidata et je vous propose une traduction de la réponse obtenue. N’hésitez pas à réagir là-bas en anglais ou ici en français, je pourra me charger de lui transmettre Noé 17 novembre 2016 à 09:24 (UTC)

Message original

I have recently done a few edits on the German Wiktionary, in order to get a feel how easy the current environment is. And I think there is some space for improvement. It is obvious that current editors are used to the current system, and also that the current system has some awesome features that have been fine-tuned and perfected over the years. In my understanding, there is no intention in replacing all of this with Wikidata. The workflows that currently work will remain, and can be used by the community as long as they like.

In Wikidata I expect a new community to be established. I hope there will be significant overlap with the existing Wiktionary communities, but in the end, there will be new processes, workflows, and community interactions. Each of the Wiktionary communities and subcommunities will decide by themselves how to deal with the respective Wikidata communities and their content and workflows.

To make this more explicit, I would be (very positively) surprised if the French Wiktionary community working on the French lexicon would any time soon start to base their workflows around Wikidata. This is a community I expect to come to Wikidata rather late. Not because I think they are in any sense technophobe or neophobe or whatever, no, just because they are actually a highly successful and functioning project and community. The first communities I expect to come over and embrace data from Wikidata is either communities dealing with a language with many speakers in a Wiktionary not native to that language - e.g. the German Lexicon in the French Wiktionary, or the Spanish lexicon in the Dutch Wiktionary, or similar.

So my expectations are thus that a whole new community will grow on Wikidata - just as it did for the ontological content of Wikidata, the Q-Space. And for them I expect that it will be easier to create Lexemes in Wikidata than it would be to create them in the current Wiktionaries, due to the interface and data model.

Wikidata does not plan to cannibalize the existing communities, but rather to seed and create new ones. I'd define success if there is a significant number of new Wikimedia contributors for lexical data, just as there is now a significant number of new Wikimedia contributors working on the ontological part of the knowledge base. I hope this makes sense.

Obviously, this is my understanding - I am not speaking for the Wikidata team in Berlin. --Denny (discussion) 19:54, 9 November 2016 (UTC)

Thank you for your detailed answer. I think this is very interesting. Are you ok if I translate and repost this in French Wiktionary? I think Wiktionaries may challenge this problem internally by translating help pages and create a friendly environment for newcomers that do not speak the main language of a precise wiki. But that's time-consuming. If Wikidata want to handle it, that's cool. I feel we are at the edge of a long path of Help page writing/translation. Kind of scary. Noé (discussion) 21:03, 9 November 2016 (UTC)

Yes, I am. I am sorry that my French is not good enough to participate in the conversation directly. --Denny (discussion) 01:38, 10 November 2016 (UTC)

That's ok, my English is bad, language learning is tough :) I feel I was quite violent in my question tho. I apologize. Still, I feel your answer is that it will not change so much for the way we contribute. Maybe it is a reason for a low enthusiasm for your plan. Plus, we are afraid that it make contribution harder to manage by dividing the content in two different place of storage. Noé (discussion) 09:56, 10 November 2016 (UTC)

No need to apologize. I understand that communication across the language barrier can be hard and fraught with misunderstanding. Let's continue to keep an open mind and assume good faith :)

Indeed, it will not change much the way of the current contributions if you don't want to. Or you can change your workflows and completely rely on Wikidata. It is entirely up to the communities for each of them to decide how much and when they feel comfortable with using Wikidata.

Regarding the duplication, whereas it is correct that we are adding another place of storage, I still think it will reduce replication, and make it easier overall. Why? Well, you are saying that there will be two places of storage in the future. That is incorrect. There will be 174 places of storage in the future. Today there are 173 places. But in the future, we can get rid of some of them thanks to the centralized new place. Even if the French Wiktionary community won't use the data from Wikidata immediately for their French lexicon, the Croatian Wiktionary community might be using it for their French lexicon, and Korean Wiktionary community might be using it for their French lexicon, and suddenly they cooperate in a way the could not before. So, no, it is not an increase from 1 to 2, but from 173 to 174, with the potential to decrease organically after. --Denny (discussion) 17:11, 10 November 2016 (UTC)

J'ai récemment fais quelques modifications sur le Wiktionnaire germanophone afin d'avoir une idée de la facilité à utiliser l'environnement actuel. Je pense que des améliorations sont possibles. Il est évident que les contributeurs actuels sont habitués au système actuel, et que le système actuel a de belles fonctionnalités qui ont été affinées et perfectionnées au fil du temps. Ma perception des choses, c'est qu'il n'y a pas d'intention de remplacer tout cela avec Wikidata. Le flux de travail qui fonctionne actuellement va rester le même, et il pourra rester en utilisation aussi longtemps que souhaité.

Dans Wikidata, je compte sur la création d'une nouvelle communauté. J'espère qu'il y aura un partage des contributeurs (overlap) avec les communautés existantes dans les Wiktionnaires, et qu'au final il y aura de nouveaux processus, formes de travail et interactions entre les contributeurs. Chacune des communautés et sous-communautés dans les Wiktionnaires décideront de la manière de gérer le contenu et les intérations avec les communautés Wikidata.

Pour rendre cela plus explicite, je serais (très positivement) surpris si les contributeurs du Wiktionnaire francophone intéressés par le lexique francophone se mettait à modifier rapidement leurs façons de contribuer en y intégrant Wikidata. C'est une communauté que je pense voir venir vers Wikidata plus tardivement. Non pas parce que je penserai qu'ils sont d'aucune façon technophobes ou néophobes ou que sais-je, non, mais plutôt parce qu'ils sont déjà une communauté et un projet qui fonctionne très bien. Les premières communautés que je compte voir venir et apprécier les données Wikidata seraient les communautés qui contribuent sur des langues qui ne sont pas la langue de travail du projet sur lequel elles contribuent, par exemple le vocabulaire allemand dans le Wiktionnaire francophone, ou le vocabulaire hispanophone dans le Wiktionnaire néerlandais.

Du coup, mes prévisions vont plutôt vers le développement d'une communauté nouvelle sur Wikidata, à l'instar de ce qui s'est passé avec l'ontologie mise en place dans l'espace de nommage Q-. Et pour eux, je prévois qu'il sera plus facile de créer des Lexèmes dans Wikidata que de créer du contenu dans les Wiktionnaires, à cause de l'interface et du modèle des données.

Wikidata ne prévois pas de cannibaliser les communautés existantes, mais plutôt de planter les graines pour de nouvelles. Je considérerai que ce sera un succès si un nombre significatif de nouveaux contributeurs aux projets Wikimedia pour des données lexicales, comme il y a eut de nombreux nouveaux contributeurs qui ont améliorés la partie ontologique de la base de connaissances. J'espère que ces explications sont claires.

Bien sûr, tout ceci est ma compréhension des choses, je ne suis pas en train de parler au nom de l'équipe Wikidata de Berlin. --Denny (discuter) 19:54, 9 novembre 2016 (UTC)

Merci pour cette réponse détaillée. Je trouve que c'est très intéressant. Serais-tu d'accord pour que je traduise ce message sur le Wiktionnaire francophone ? Je pense que les Wiktionnaires devraient affronter ce problème différemment, en traduisant leurs pages d'aide et en mettant en place des environnements accueillant pour les nouveaux arrivants qui ne parlent pas la langue principale d'un wiki. Mais c'est chronophage. Si Wikidata souhaite gérer ça, c'est cool. J'ai le sentiment que nous sommes sur le seuil d'un long chemin de traduction/écriture de pages d'aide. C'est un peu effrayant. Noé 21:03, 9 novembre 2016 (UTC)

Je suis d'accord. Je suis désolé que mon français ne soit pas suffisamment bon pour participer à la conversation directement. --Denny (discussion) 01:38, 10 novembre 2016 (UTC)

Ca va, mon anglais n'est pas bon non plus, les langues étrangères c'est difficile :) En y repensant, j'ai l'impression que ma question initiale était assez provoc'. Je m'en excuse. Pour autant, j'ai l'impression que ta réponse est que ça ne changera pas grand chose dans nos façons de contribuer. C'est peut-être la raison du faible enthousiasme pour votre travail. De plus, nous craignons que cela rende la contribution plus difficile à gérer de par la division du contenu en deux lieux de stockages différents. Noé (discussion) 09:56, 10 novembre 2016 (UTC)

Pas la peine de t'excuser. Je comprends bien que la communication malgré la barrière des langues peut être difficile et provoque des incompréhensions. Continuons de garder l'esprit ouvert et d'assumer la bonne fois :)

Bien sûr, cela ne va pas changer la façon dont vous contribuez si vous ne le souhaitez pas. Mais vous pouvez aussi changer votre manière de contribuer et vous appuyer sur Wikidata. Ce choix revient complétement aux communautés pour qu'elles décident à quel point elles sont à l'aise avec l'utilisation de Wikidata.

A propos de la duplication, bien qu'il soit juste de dire que nous ajouterons un autre lieu de stockage, je considère que cela va réduire la copie, et rendre les choses plus simples au final. Pourquoi ? Et bien, tu dis qu'il y aura deux lieux de stockage dans le futur. C'est incorrect. Il y aura 174 lieux de stockage dans le futur. Actuellement, il y en a 173. Mais dans le futur, nous pourrons nous défaire de certains d'entre eux grâce à l'utilisation d'une nouvelle place centrale. Même si la communauté du Wiktionnaire francophone n'utilise pas Wikidata immédiatement pour le lexique francophone, la communauté du Wiktionnaire croate pourrait utiliser ces données pour leur lexique francophone, et le Wiktionnaire coréen pourrait l'utiliser pour son lexique francophone, et ils se retrouveraient à coopérer d'une manière inédite. Donc, non, cela ne va pas accroitre de 1 à 2 mais de 173 à 174, avec le potentiel pour que cela puisse décroitre organiquement par la suite. --Denny (discussion) 17:11, 10 novembre 2016 (UTC)

Wikidata va-t-il débaucher les contributeurs du Wiktionnaire ?

Suite des échanges postés sur Wikidata. Ils débutent par une question de Noé (qui traduit tant bien que mal en français cet échange) suivis par une question de Amgine et par une réponse de Denny, un des développeur de Wikidata. Amgine revient demander plus de précisions et Denny lui répond. Si vous souhaitez poursuivre les questions, n’hésitez pas à les formuler ici en français, je peux les traduire Noé 24 novembre 2016 à 08:59 (UTC)

Message original

I translated this conversation to French and a sentence bring my attention. I quote you, highlight is mine: "Today there are 173 places. But in the future, we can get rid of some of them thanks to the centralized new place." I am not sure if you are talking about closing some small Wiktionaries here. I am still quite confuse to get if you imagine Wiktionary to become in the future (5 years, 10 years from here) mostly or only 1. a reader interface or 2. an editing interface for data stock in Wikidata.

Well, in my understanding, you imagine people contributing to Wikidata on lexical data without knowing of Wiktionary workflow. I expect debates to pop again on lexicographical decisions already discussed during hours in Wiktionaries and fixed in Conventions pages locally. If some contributions are to be made directly in Wikidata, how Wiktionarians that became - by contributing - experts on collaborative lexicography can communicate with this new community to share its knowledge on lexicography and the wise decisions took after hours of debate? To give a specific example, I spent five months last year to build a solid convention for how to deal with pronunciation in Wiktionary, to provide three field instead of two. Before it was a merely phonological form (something wrong by definition), specific pronunciation linked with a recording and eventually one phonological strict form. New convention is: a consensual non-marked pronunciation inside \\, a strict pronunciation linked with sound inside [] and possibly several phonological propositions yeld by different authors, //. It is much more neutral and we are not destroying the definition of phonological anymore. Ok, so, if someone add French pronunciation in Wikidata, how can we be sure one respect this convention? And if English Wiktionary want to reuse French pronunciation, how can they deal with this convention? I hope this makes sense, despite the different questions raised here. Noé (discussion) 10:02, 17 November 2016 (UTC)

Denny has made clear on this talk page and elsewhere that Wikidata is forking the Wiktionary project, intends to poach Wiktionary contributors to the Wikidata edition, and to supplant/replace Wiktionary except as a presentation layer. There is merit to his intention; mediawiki is not a good tool for a linguistics dictionary. There is a history of such projects and intentions, and imo they have harmed both Wiktionary and the forking projects, but the communities now are not the same as they were in the past and maybe Denny's effort will have a different outcome. - Amgine (discussion) 15:34, 17 November 2016 (UTC)

Hi Noé! Thanks for asking for a clarification - I definitely did not mean to close any Wiktionaries. I actually think they will thrive more due to Wikidata. But that is besides the point at hand. When I said "get rid of some of them" I meant that in some of those 173 places we can get rid of some data within specific Wiktionaries. Some of the entries in some of the Wiktionaries can decide locally to replace their local data with data from Wikidata. That is what we can get rid of.

Wiktionary is much more than just the structured data. And the Wiktionaries would still continue to fulfill these additional functions, and could indeed focus on them and thus become more effective.

Regarding lexicographical decisions being reached on a specific Wiktionary: this is multifaceted, but let's take a look at the simplest cases: the fact that you had so much effort in creating this decision speaks for a strong community. As I said before, my expectation is that Wikidata will be particularly useful for the sub-projects of Wiktionary which do not have such a strong community. These projects will often not have such a strong commitment to decisions like these. I would consider it often to be smart to follow the lead of the most active community with such decisions.

In the case were Wikidata and a local Wiktionary project have an incompatible lexicographic decision, that would be unfortunate. I don't think if these cases will happen often, considering the highly flexible data model of Wikidata that allows for a diversity of points of view, but it is possible. So if this happen, that particular community with that decision will be struggling with using Wikidata as their database. But don't forget, they don't have to. And considering that they are likely a strong community, there would be also have fewer advantages from Wikidata in the first place.

In the particular case of the pronunciations, it is possible to model it in Wikidata. OK. But the question that you have is whether the Wikidata community will agree with the decisions from the French Wiktionary, which is unpredictable. But that's the same problem as Wikidata already has for the Wikipedias today. And the solution is: well, Wikidata is not a panacea. It can only help with a certain number of use cases, and it doesn't aim at more than that. The problem you described will become slightly more tractable than today, but it won't be automatically solved. It will cost considerable social investment by all players.

Regarding Amgine's point, there is no plan to fork Wiktionary, there is to the best of my knowledge no plan to poach Wiktionarians, and there is no plan to replace Wiktionary on all but the presentation layer. If you look at the suggested work plan, none of these things are planned. If there is, please point me to it. --Denny (discussion) 21:12, 17 November 2016 (UTC)

My only rebuttal to the above:

Ime, there would not be concern raised about copyright license incompatility from the wikidata community if there were not already competing identical content. I do not believe anyone can honestly say a Wikidata representation of a dictionary does not meet the mission "to create open content dictionaries in every language." You cannot be creating a dictionary without forking the mission.
Although there may be no formal plan, above you describe targeted Wiktionarian communities for recruitment, and those you "…expect to come to Wikidata rather late," and the hope there will be overlap between the Wikidata and Wiktionary contributors. This directly contradicts what you said; you do have expectations and hopes of poaching Wiktionarians, and have suggested who to approach.
Again, although there is no formal plan for Wiktionary to become a presentation layer it is the logical result of your project, assuming it is successful.

I am not making value judgements about the above, since in principle I agree with the goal of structuring Wiktionary data. But legerdemain to hide what you are doing makes dupes of your volunteers; the project should be supported by informed peers. - Amgine (discussion) 22:47, 17 November 2016 (UTC)

I don't describe targeting Wiktionary communities for recruitment. I describe Wiktionary communities deciding to use the data from Wikidata or not, and I expect that very active subcommunities will come later to Wikidata. I admit to wish and hope that there will be Wiktionary community members who will enjoy contributing to Wikidata in the future, but there are no plans at all for recruiting actively in these communities (to the best of my knowledge).

Let's take for example Wikispecies as a comparable case study. By the size of the active community, Wikispecies, if it were a Wiktionary, would rank about #5 out of 173 Wiktionaries, roughly the size of the Polish and almost the size of the German edition of Wiktionary. The French edition is about two or almost three times as large as Wikispecies. Wikispecies could be considered also a very data-heavy project, and thus provides a perfect use case for how Wiktionary may develop. But the impact on the size of the community - well, I don't see any. And as far as I can tell, there was no recruiting from the community, etc. I really don't see why this would be different for Wiktionary.

There is plenty of content in Wiktionary which is not amenable to Wikidata - e.g. the appendices in the English Wiktionary, pages on grammar, etc. I think the richness of Wiktionary is being underestimated in the conversation here - Wiktionary is much more than what some structured data can capture. And all of that would remain a unique feature of the Wiktionary projects. --Denny (discussion) 03:31, 19 November 2016 (UTC)

J'ai traduit cette conversation en français et une phrase a attiré mon attention. Je te te cite, en mettant en gras ce qui me dérange : "Aujourd'hui il y a 173 lieux de stockage mais dans le futur, nous pourrons nous débarasser de certains grâce au nouveau lieu centralisé." J'ai l'impression que tu parles de fermer quelques petits Wiktionnaires ici. J'ai toujours du mal à appréhender comment tu imagines le Wiktionnaire dans le futur (à 5 ans, à 10 ans), si ce serait plutôt ou seulement 1. une interface de lecture, ou 2. une interface de modification pour des données contenues dans Wikidata.

Si j'ai bien compris, tu imagines que les gens ajouteront des données lexicales dans Wikidata sans connaître le fonctionnement du Wiktionnaire. J'imagine sans mal que des débats sans fin vont resurgir sur des décisions qui ont pris des heures à être enterinées sur le Wiktionnaire. Si des contributions doivent être faites directement dans Wikidata, comment les Wiktionnaristes, qui sont devenus - par la contribution - experts sur la lexicographie collaborative, pourront communiquer avec cette nouvelle communauté afin de partager sa connaissance de la lexicographie et les décisions éclairées prisent après des heures de débat ? Pour donner un exemple spécifique, j'ai passé cinq mois l'an dernier pour construire une convention solide sur la manière de gérer la prononciation dans le Wiktionnaire, qui conclue à l'utilisation de trois symboles au lieu de deux. C'est plus neutre et nous ne distordons plus la définition de "prononciation phonologique". Mais du coup, si quelqu'un ajoute des prononciations françaises dans Wikidata, comment pouvons nous être sûr qu'il respectera cette convention ? J'espère être clair malgré les différentes questions abordées ici. Noé (discussion) 10:02, 17 novembre 2016 (UTC)

Denny a clairement dit sur cette page de discussion et ailleurs que Wikidata va créer une branche distincte du Wiktionnaire (fork), avec l'intention de débaucher les contributeurs du Wiktionnaire, et de supplanter/remplacer le Wiktionnaire à part pour ce qui est de présenter les données. Il y a du bon dans cette intention, MediaWiki n'est pas un bon outil pour faire un dictionnaire linguistique. Il y a un historique de projets et d'intentions similaires, et à mon humble avis, ils ont causés du tord aussi bien au Wiktionnaire qu'aux projets distincts, mais les communautés d'aujourd'hui ne sont pas celles d'hier et peut-être que les efforts de Denny mèneront à une fin différente. - Amgine (discussion) 15:34, 17 novembre 2016 (UTC)

Salut Noé ! Merci de demander des éclaircissements - car je ne voulais vraiment pas dire que je souhaite la fermeture d'aucun Wiktionnaire. Je pense plutôt qu'il vont plutôt s'enrichir grâce à Wikidata. Mais cela va au-delà de ce que je maitrise. Quand je dis "se débarasser de certains", je voulais dire que dans certain des 173 lieux de stockage, nous pourrons nous débarasser de certaines données. Quelques entrées dans quelques Wiktionnaire pourront décider localement de remplacer leurs données par des données de Wikidata. C'est ainsi que l'on pourra s'en débarasser localement.

Wiktionnaire est bien plus que des données structurées. Et les Wiktionnaires continueront de remplir les autres fontions, et pourront bien sûr se concentrer sur elles et devenir plus efficace.

A propos des décisions lexicographiques prises sur des Wiktionnaires spécifiques : c'est multiface, mais prenons un cas simple : le fait que tu ai dépensé tant d'énergie pour mettre en place cette décision indique une communauté forte. Comme je l'ai écris plus haut, mon espoir est que Wikidata soit particulièrment efficace pour les sous-projets des Wiktionnaires qui n'ont pas de communautés fortes. Ces projets n'ont généralement pas pris de décisions comme celle-ci. Je considère qu'il est souvent mieux de suivre les décisions des communautés les plus actives sur de telles décisions.

Dans le cas ou Wikidata et un projet Wiktionnaire ait pris des décisions lexicographiques incompatible, ce serait malheureux. Je ne crois pas que ces cas se présenteront souvent, considérant la très grande flexibilité d'expression des points de vues permise par la modélisation des données de Wikidata, mais c'est possible. Donc si ça arrive, une communauté spécifique pourrait se retrouver en difficulté pour utiliser les données de Wikidata. Mais n'oublions pas qu'elle n'a pas à le faire. Et en considérant qu'il s'agit d'une communauté forte, elle n'aura que peu d'avantages à le faire au départ.

Dans le cas particulier des prononciations, il est possible de modéliser ça dans Wikidata. OK. Mais la question que tu soulèves est de savoir si la communauté Wikidata va suivre les décisions prises par le Wiktionnaire francophone, et c'est impossible à prévoir. Mais c'est le même problème que celui qu'a Wikidata aujourd'hui avec les Wikipédias. Et la solution est : bon ben, Wikidata n'est pas la panacée. Il peut seulement aider dans un certain nombre de cas, et il ne vise pas plus que ça. Le problème que tu soulèves deviendra légèrement plus gérable mais il ne sera pas résolu automatiquement. Il va coûter un investissement social considérable de la part de toutes les parties.

A propos du point soulevé par Amgine, il n'y a pas de projet de diviser le Wiktionnaire (de le forker), et à ma connaissance, il n'y a pas de projet de débaucher les contributeurs des Wiktionnaires, et il n'y a pas de plan pour remplacer les Wiktionnaires en tout point sauf pour le rendu visuel. Si vous regardez le plan suggéré, aucune de ces choses n'y figure. Si elles y sont, merci de m'indiquer où. --Denny (discussion) 21:12, 17 novembre 2016 (UTC)

Mes réfutations à ce qui précède :

Dans mon expérience, il n'y aurait pas de préoccupations sur les incompatibilités de licence s'il n'y avait pas déjà de compétition pour un contenu identique. Je crois que personne ne pourrait dire honnêtement que la représentation d'un dictionnaire dans Wikidata ne rejoint pas la mission de "créer des dictionnaires ouverts dans toutes les langues". Tu ne peux pas créer un dictionnaire sans créer un duplicata de la mission (forking the mission).
Bien qu'il n'y ai pas de plan formel, tu as décris plus tôt vouloir cibler les communautés des Wiktionnaire pour du recrutement, et en cela tu "...espère qu'ils viendront à Wikidata par la suite", et tu espères qu'il y aura des personnes qui contribueront aussi bien à Wikidata qu'au Wiktionnaire. Cela vient directement en contradiction avec ce que tu disais ; donc tu a des attentes et des espoirs quant au débauchage de wiktionnaristes, et a suggéré qui approcher.
Là encore, bien qu'il n'y a pas de plan pour que le Wiktionnaire devienne uniquement un lieu de présentation des données, c'est le résultat logique de ce projet, s'il réussit.

Je ne fais pas de jugement de valeur sur ce qui précède, puisque dans le principe je suis d'accord avec les buts de structurer les données des Wiktionnaires. Mais le tour de passe-passe de cacher ce que vous être en train de faire dupe les bénévoles ; ce projet devrait être soutenu par des personnes informées. - Amgine (discussion) 22:47, 17 novembre 2016 (UTC)

Je n'écrivais pas de cibler les communautés des Wiktionnaires pour le recrutement. J'écrivais que les communautés décideraient d'utiliser ou non les données de Wikidata, et que j'espérais que des sous-communautés très actives viendraient ensuite sur Wikidata. J'admets souhaiter et espérer qu'il y aura des wiktionnaristes qui apprécieront de contribuer à Wikidata dans le futur, mais il n'y a pas de plan du tout pour aller les recruter activement dans leurs communautés (dans les limites de mes connaissances).

Prenons l'exemple de Wikispecies comme un cas d'école. De par la taille de sa communauté active, Wikispecies, si c'était un Wiktionnaire, serait classé cinquième sur 173 projets, à peu près la taille du Wiktionnaire polonais et presque la taille du Wiktionnaire germanophone. L'édition francophone est entre deux et trois fois plus grande que Wikispecies. Wikispecies peut être considéré également comme un projet principalement de données, et donc se présente comme un bon cas d'école pour voir comment les Wiktionnaires pourraient se développer. Sur l'impact sur la taille de la communauté, et bien, je n'en voit aucun. Tout ce que je peux dire, c'est qu'il n'y a pas eut de recrutement dans cette communauté, etc. Je ne vois vraiment pas pourquoi ce serait différent pour les Wiktionnaires.

Il y a beaucoup de contenu du Wiktionnaire qui n'est pas déplaçable vers Wikidata, par exemple les annexes, les pages de grammaire, etc. Je pense que la richesse des Wiktionnaire est sous-estimée dans cette discussion - Wiktionnaire est bien plus que ce que des données structurées peuvent capturer. Et tout cela restera l'apanage des projets Wiktionnaires. --Denny (discussion) 03:31, 19 novembre 2016 (UTC)

Garde-fous

Bonjour,

Ces temps-ci, je pose pas mal de questions aux développeurs de Wikidata à propos de leur projet vis-à-vis du Wiktionnaire. J'en ai traduit de bons morceaux ci-dessus et j’en suis arrivé à une réflexion que j’ai eu bien du mal à écrire en anglais. Je l’ai présenté aux contributeurs Wikidata francophones et je souhaite la partager avec vous ici afin de recueillir vos avis et d’éventuellement l’étayer encore un peu.

Je considère que la partie de Wikidata qui sera dédiée à la lexicographie pour les mots de la langue française devrait être intouchable et modifiable uniquement à partir du Wiktionnaire francophone, même si les données sont stockées dans Wikidata (de même pour l'anglophone par le Wiktionnaire anglophone s'ils souhaitent qu'il en soit de même, etc.). J'y vois quatre avantages :

La modification de contenu se ferait dans le Wiktionnaire grâce à des outils mis en place au fil des années et qui fonctionnent plutôt efficacement (notamment pour l'ajout de flexions), tandis que l'éditeur de Wikidata pour des données lexicographiques est encore à développer et risque de mettre des années avant d'être aussi performant.
Les liens entre ce qui est de la donnée (stockés sur Wikidata) et ce qui n'en est pas (stockés sur le Wiktionnaire) pourraient être maintenu plus efficacement (rédaction étymologique, fichiers sons et descriptif des variations de prononciation, lien avec des thésaurus, etc.)
La patrouille des modifications serait effectuée par des contributeurs aguerris qui suivent déjà les pages qu'ils ont créé et qui sauraient orienter vers les conventions lexicographiques et les aides adéquates.
Les données stockées sur Wikidata ne deviendraient pas progressivement différentes entre celles présentées dans le Wiktionnaire, ni ne pourraient être modifiées par des personnes ne maîtrisant pas le sujet, contrairement a ce qui advient avec Wikipédia et qui crée tant de crispations.

Qu’en pensez-vous ? Noé 25 novembre 2016 à 13:54 (UTC)

Je suis totalement Pour. — Lyokoï (Discutons

) 25 novembre 2016 à 14:58 (UTC)

Pour moi un des principaux intérêts de Wikidata est de proposer de véritables relations entre les données, par exemple l'identification de chaque mot, de chaque sens, permet de lier les différents synonymes et traductions, ou encore de lier les sens équivalents dans les éditions en autres langues, bref faire des liens non plus seulement entre noms d'articles (ou, à la main, entre noms de sections), mais entre langues, mots, et sens. Or ces informations de liens se feront en plus de ce que les Wiktionnaire contiennent déjà. Idéalement il ne devrait donc pas y avoir de recouvrement direct entre Wikidata et le contenu actuel des Wiktionnaire, et du coup la partie Wikidata serait relativement agnostique en terme de projets.

Si par contre on se met à stocker également des données (définitions, étymologies, exemples...) alors, oui, cette restriction a du sens. — Dakdada 25 novembre 2016 à 15:32 (UTC)

Moi aussi, j’aimerais qu'il n’y ait pas recouvrement, que ce soit éventuellement un outil disponible, mais pas plus. Je ne comprends pas bien l’avantage 2, sans doute parce que ça fait référence à des suppositions non explicitées. Oui, la proposition serait rassurante pour le français. Mais je voudrais dire aussi que ce n’est pas que pour le français qu'on a des outils mis en place au fil des années. Lmaltier (discussion) 25 novembre 2016 à 17:19 (UTC)

Spécifications du modèle de données technique

Bonjou, le travail a commencé sur la création d’un document technique décrivant le modèle de données utilisé pour stocker les élément "Lexeme" dans Wikidata. C’est encore un brouillon mais je pense qu’on a intérêt à y jeter un œil. Ca se passe ici. Pamputt ^[Discuter] 13 mars 2017 à 16:38 (UTC)

C’est moi ou ils ne nous ont pas écouté ? — Lyokoï (Discutons

) 14 mars 2017 à 22:02 (UTC)