Wiktionnaire:Actualités/131-février-2026
Actualités du Wiktionnaire

Wiktionnaire:Actualités est un journal mensuel sur le Wiktionnaire, les dictionnaires, les mots et les langues. Il est publié en ligne depuis avril 2015. Son écriture est ouverte à toutes les bonnes volontés. Vous pouvez consulter les anciens numéros, participer au brouillon de la prochaine édition ou vous inscrire pour recevoir un avis lors de la publication des prochains numéros. Vous pouvez aussi lire le mensuel Regards sur l’actualité du mouvement Wikimédia. Pour les commentaires, critiques ou suggestions, voir en bas de page ainsi que la page de discussion.
Deux spirobranches arbre de Noël (Spirobranchus giganteus) photographiés par keesgroenendijk (cliquez sur l’illustration pour la voir en entier).
Brèves d’ici
- Richaringan a donné une longue interview au périodique Regards sur l’actualité du mouvement Wikimédia (RAW) publié en février dans l’édition française de Wikipédia. Il y parle de son intérêt pour les langues et de ses activités sur le Wiktionnaire de manière plus générale.
- Le 15 février 2026, le Wiktionnaire atteint les 500 bonnes entrées en français, avec les locutions nominales « orchestre philharmonique » et « orchestre d’harmonie ».
- Lepticed7 propose d’organiser des soirées patrouille afin de relire collectivement les nouvelles entrées qui ne sont plus aussi bien contrôlées que par le passé.
- Une opération de documentation et de numérisation d’un musée sur le point de fermer, la Mission Gourmande, a permis la mise en ligne de nombreuses illustrations et la retouche d’entrées du Wiktionnaire autour du thème de la cuisine.
- Danÿa propose de sortir le mode sombre de l’habillage du Wiktionnaire de la version bêta, suite aux nombreux ajustement colorimétriques réalisés ces derniers mois.
- Sik666 relance le sujet du traitement des fautes d’orthographe dans le Wiktionnaire.
À voir ou écouter
Quelques émissions audio ou vidéo sur la lexicographie, la linguistique et la langue française ou d’autres sorties ou découvertes ce mois-ci.
- Le 27 janvier 2026, Radio Kreiz Breizh a diffusé une archive sonore en breton de 1994 consacrée au tunodo, un cryptolecte breton parlé par les chiffonniers et les couvreurs de La Roche-Derrien, la « capitale de l’étoupe », avant de disparaître en même temps que la culture du lin dans les années 1950.
- Le 29 janvier, le linguiste Wim Remysen était l’invité de la station québécoise Radio VM pour discuter du fait que les Québécois parleraient de plus en plus comme les Français.
- Pour France Culture, Marie Sorbier s’entretient avec le linguiste Alexis Michaud sur les archives sonores et en particulier la plateforme Pangloss dont il s’occupe.
- Arnaud Hoedt revient sur
l’histoire d’Amandine qui mange à la cantinele phénomène de l’affrication. Sans même mentionner que ce mot a été élu Mot de l’année par la communauté du Wiktionnaire en 2024 !
- Eva Roque, qui anime l’émission « Capture d’écrans » sur France Inter, présente l’activité de Sébastien Grimaud, qui raconte des faits de langue en courtes vidéos sur internet sous le nom d’ÉtymoCurieux.
- Erica Brozovsky, qui anime l’émission anglophone Otherwords, a publié une nouvelle vidéo sur les dynamiques de contact entre le coréen et l’anglais.
- Rob Watts, qui propose régulièrement des vidéos en anglais sur la linguistique, propose cette fois-ci une vidéo sur la communication animale.
Une petite sabelle photographiée par Diego Delso.
Statistiques
Pour information : comme indiqué le mois dernier, les copies d’archivages (dumps) ne sont dorénavant produites par les équipes techniques de la Wikimedia Foundation qu’une seule fois par mois, en début de mois, ce qui amène à présenter des statistiques décalées d’un mois par rapport à la date de publication du numéro des Actualités.
- Du 1er janvier 2026 au 1er février 2026
+ 17 083 entrées et 107 langues dont le nombre d’entrées a été modifié, pour atteindre 7 073 663 entrées et 1 548 langues avec au moins cinq entrées.
+ 1 725 entrées en français pour atteindre 439 932 lemmes et 704 671 définitions.
Les cinq langues qui ont le plus avancé, outre le français, sont le finnois (+ 8 262 entrées), le luxembourgeois (+ 1 530 entrées), le japonais (+ 862 entrées), le breton (+ 678 entrées), et l’italien (+ 661 entrées).
Une nouvelle langue : le vieux norvégien (+9).
+ 2 786 citations ou exemples en français pour atteindre 710 007 pour les entrées en français, et 351 288 pour les entrées d’autres langues (+2 047)
+ 485 médias d’illustrations (images et vidéos) dans les pages principales du Wiktionnaire, pour atteindre 102 793.
+ 602 sections de langue contenant au moins une prononciation audio (dont 42 pour le français) pour atteindre 921 265 sections de langue contenant au moins une prononciation audio pour 206 langues (dont 207 919 pour le français).
+ 20 nouveaux thésaurus ce mois-ci, le total est de 1 950 thésaurus dans 108 langues dont 1 321 thésaurus en langue française (+ 12). Les nouveaux thésaurus sont la donnée de recherche par Le Commissaire ; les unités de mesure en occitan par Fagairolles 34 ; la vannerie par Stephane8888 ; les plantes tinctoriales en français, en anglais et en espagnol, le colorant en français, en anglais et en espagnol, les plantes textiles en français, en anglais et en espagnol, la mercerie, la quincaillerie, la serrurerie, l’analyse sociale, l’histoire de l’art et les arts décoratifs par Pixeltoo ; le jour (cycle) en swahili par Thomas le numéro 24 ; le parfum par MCmots.
+ 3 nouvelles bonnes entrées, pour atteindre 1 632 bonnes entrées (dont 501 en français). Au total, 39 langues proposent des bonnes entrées. Outre les deux nouvelles bonnes entrées déjà mentionnées dans les brèves, la troisième est violoncelle, proposée par Harmonide.
Wikiscan et Wikistats donnent chaque mois accès à beaucoup de mesures, dont la liste des pages les plus consultées et des pages modifiées par le plus de personnes.
+ 8 mots créés sur les 29 proposés dans les Mots du jour ! Bravo à Bercours et Pamputt !
Brèves d’ailleurs
- La Dicothèque reprend un rythme soutenu de mises à jour, le 2 février puis le 15 février. Présenté dans les Actualités de novembre 2024, la Dicothèque est une plateforme de consultation des dictionnaires relus ou en cours de relecture dans Wikisource, qui propose actuellement 46 dictionnaires, avec une nomenclature de plus de 160 000 entrées pour plus de 100 000 graphies uniques. C’est un projet réalisé par une petite équipe bénévole : Poslovitch, Lyokoï, Lepticed7, Noé.
- Arnaud Bernier, dont on avait signalé les publications sur les langues régulières sur LinkedIn à l’occasion d’une chronique inspiré d’un de ses billets, sur les langues aux noms ambigus (en janvier 2024), rédige maintenant des billets sur le site Dis-moi Robert, notamment pour répondre à la grande question : À quoi servent les dictionnaires ?
- Anne Gensane poursuit ses articles de vulgarisation pour The Conversation France en présentant ce mois-ci le phénomène de l’algospeak, les termes développés pour éviter la censure des algorithmes sur les plateformes numériques.
- Le site personnel Etymologistan propose des articles sur l’étymologie, et notamment ce mois-ci sur le ladin, la langue de la région où se déroulaient les jeux olympiques d’hiver.
- Nora Bouazzouni s’entretient avec Grégoy Miras, de l’ATILF, pour le Journal du CNRS à propos de son projet Prosophon, qui explore la discrimination linguistique liée à l’accent.
- Jean-François Ducharme rapporte sur le site d’actualité de l’Université du Québec à Montréal une opération pour revitaliser la langue inuinnaqtun organisée par le linguiste Richard Compton, qui a mis en ligne un dictionnaire d’inuinnaqtun.
Le portail lexical de l’ATILF
Mis en ligne ce mois-ci, le Portail Lexical est une plateforme de consultation de dictionnaires. Ce portail est à l’initiative du laboratoire Analyse et Traitement informatique de la langue française (ATILF), structure de l’Université de Lorraine et du CNRS, à Nancy, France. Il s’agit d’une nouvelle version du Centre national de ressources textuelles et lexicales (CNRTL), plateforme qui propose déjà de nombreux outils et services autour des langues et d’un dictionnaire principal dont l’ATILF a la responsabilité, le Trésor de la langue française, réalisé entre 1960 et 1994, appelé affectueusement TLF. Il s’agit en particulier de l’édition numérique réalisée entre 1990 et 2001, le Trésor de la langue française informatisé (TLFi).
Cette ressource a été au cœur d’un important travail de refonte de l’encodage afin de restructurer tout le balisage dans un format XML plus exploitable. Ce chantier, par Jessika Cardinali, Evelyne Jacquey, Sandrine Ollinger et Étienne Petitjean, a duré plusieurs mois, et a abouti à deux publications de synthèse. La première présente tout le travail réalisé sur le balisage, tandis que le rapport opérationnel revient sur les enjeux et difficultés surmontées durant ce processus.
Grâce à ce chantier, le Portail lexical voit le jour, porté par la même équipe, avec en outre Mathieu Constant, directeur du laboratoire ATILF, et Benjamin Husson au développement des extensions. Car ce n’est pas un portail qui vient seulement rafraîchir l’apparence d’une plateforme existante ! Les dictionnaires déjà présents au sein de la version précédente – qui reste disponible en ligne – sont encore là : TLFi, dictionnaires de l’Académie française (4ème, 8ème et 9ème éditions), le Littré et le Dictionnaire du Moyen Français. Mais à ceux-là s’ajoute une ressource surprenante, un dictionnaire bien plus moderne et à jour sur la documentation des usages du français courant. Oui, le portail lexical de l’ATILF intègre le Wiktionnaire !
C’est un évènement, un adoubement dont le Wiktionnaire ne pouvait que rêver ! Après avoir été reconnu pour sa qualité suffisante pour servir de matériel de base pour la publication d’un dictionnaire imprimé commercial, le Dico en 2019 (présenté dans les Actualités à sa sortie), puis après une reconnaissance politique et institutionnelle lors de son intégration parmi les ressources du Dictionnaire des francophones pour son lancement en ligne en 2021, c’est maintenant une reconnaissance par les plus grands professionnels de la lexicographie ! Une consécration inattendue mais grandiose, alors que le Wiktionnaire va célébrer ses 22 ans le 22 mars prochain.
Mais allons un peu au-delà de la bonne surprise et creusons un peu sur l’usage qui est fait des connaissances contenues dans le Wiktionnaire et reprises dans ce Portail lexical. Ce n’est pas l’ensemble du contenu qui est repris, mais seulement les entrées de français, et encore, pas l’ensemble de celles-ci mais surtout celles qui correspondent à la liste des entrées du TLFi, pour être affichée en regard à celles-ci. Elles sont présentées avec l’ensemble des exemples et de leurs sources, ainsi que toutes les étiquettes dans les définitions. Après avoir été sollicité par Lyokoï, Étienne Petitjean a précisé que les entrées du Wiktionnaire étaient ajoutées ponctuellement, à la main. Il a également indiqué être en cours de discussion pour ajouter la Base de données lexicographiques panfrancophone, une autre plateforme de consultation d’une vingtaine de dictionnaires de termes d’usage régionaux.
Les notices étymologiques sont parfois reprises, parfois tronquées lorsqu’elles sont trop longues, ou peut-être lorsqu’elles contiennent des modèles plus difficiles à moissonner. Des traductions simplifiées, pour l’allemand, l’anglais, l’espagnol et l’italien sont présentées, qui viennent également du Wiktionnaire. Les tableaux de conjugaison sont également issus du Wiktionnaire.
Au delà de la partie Wiktionnaire, quelques mécanismes internes sont encore étonnants, comme la gestion des homonymes qui permet d’arriver sur une page d’orientation mais n’offre pas ensuite de voie pour aller d’un homonyme à un autre. Par exemple quasi (nom) et quasi (adverbe) ne sont pas liées. La typographie des entrées du TLFi n’a pas été normalisée pour l’utilisation de jolie apostrophes courbes, ce qui détonne avec la rigueur du Wiktionnaire. Il est également impossible actuellement de pointer vers la définition d’un des dictionnaires en particulier, au sein de l’interface, ce qui rend les liens depuis l’extérieur moins précis.
Par ailleurs, les trois éditions du Dictionnaire de l’Académie française sont également consultables sur leur site dédié, avec des copies en fac-similés des ouvrages originaux, ce qui est une bonne pratique, garantissant le fait que le contenu est identique. Le portail lexical emprunte pourtant à ce site le fonctionnement de placer des liens sur tous les mots de l’interface pour favoriser la navigation. Le lien vers la source n’est pas non plus de rigueur pour les entrées provenant du Wiktionnaire qui n’ont pas de lien avec les pages originales et leurs historiques, contrairement à ce que la licence CC BY-SA 4.0 préconise.
Mais pour finir cette présentation sur une note positive, mentionnons le sympathique affichage de la fréquence d’usage grâce à un petit module utilisant Gallicagram – et, on l’espère, la v.2 qui vient juste de sortir publiquement – à partir d’un moissonnage des publications de la bibliothèque numérique de la Bibliothèque nationale de France, Gallica, et du journal Le Monde.Une serpule (Serpula vermicularis) photographiée par Holger Krisp.
Quelques nouvelles du projet lexicographique sur Wikidata
Commençons par quelques éléments de contexte : Wikidata, hébergé par la Wikimedia Foundation, est un projet de base de connaissances liées selon les standards du web sémantique. Cette structure facilite la description, l’organisation, l’ajout et la récupération de données. En plus des éléments (sur des concepts), Wikidata contient des lexèmes, des connaissances sur des « mots ».
Le lexème est un concept linguistique datant des années 1950. C’est une unité lexicale comptant des sens et des formes (au moins une de chaque). Sur Wikidata, le projet Lexeme a commencé en 2018. Il contient des connaissances de trois natures : lexème, sens, forme. Chacune peut contenir des propriétés décrites par des déclarations Wikidata pour, par exemple, donner le genre grammatical ou sémantique, l’étymologie, la variation morphologique, le registre de langue, la prononciation en audio ou en API, présenter des exemples, etc. Pour plus d’informations, voir la page Lexicographical data.
Après une période de mise en place (tant technique qu’éditoriale), il y a maintenant une communauté active, avec des outils, des partenariats (par exemple autour de l’occitan) et même des concours (l’an dernier en dagaare).
Quelques statistiques
En février 2026, il y a :
- 1 517 510 lexèmes (voir le chiffre à jour)
- en 1 537 langues (source)
- comptant un total de 693 427 sens (source) et 17,8 millions formes (source) dont 12,7 millions formes uniques (source), celles qui correspondent à une page dans le Wiktionnaire.
Chaque lexème est différent, certains sont encore à peine des ébauches, d’autres sont plus exhaustifs. Les sens sont encore peu nombreux, chaque lexème devrait avoir au moins un sens mais seulement 32 % des lexèmes ont au moins un sens actuellement. Côté forme, 77 % des lexèmes ont au moins une forme. Inversement, certains ont de nombreux sens ou formes présents, les records étant respectivement le toponyme Janowo en polonais avec 91 sens et le verbe eraman en basque avec 1 274 formes !
Sources et identifiants
Les lexèmes comptent aussi des liens vers des références, que ce soit des dictionnaires en ligne (en général via une propriété identifiant) ou papier (en citant alors le document et la page). Plusieurs dictionnaires en allemand ont été intégrés dans des proportions importantes (90 % pour le Wörterbuch der russisch-deutschen Übersetzungsschwierigkeiten, 60 % pour le Duden, etc.), alors qu’en français les 8 premières éditions du Dictionnaire de l’Académie française sont présentes entre 15 et 20 % (et 6 % pour la 9e édition).
Des outils comme Mishramilan permettent de faciliter l’alignement entre les lexèmes et 70 dictionnaires en ligne.
Réutilisations
Un des intérêts principaux des lexèmes est d’être interopérable par défaut et donc réutilisables. Il existe de nombreux outils comme Ordia (qui est en fait un ensemble d’outils que ce soit pour visualiser des lexèmes ou pour jouer avec les lexèmes ; par exemple un jeu pour trouver le genre d’un nom) ou Broomstick (qui permet de trouver les lexèmes auxquels il manque des informations ; voir la liste d’outils). Avec des requêtes SPARQL, on peut traiter facilement la masse de données comme générer la liste des sens ayant le plus de lexèmes (avec le même principe, on peut lister les synonymes/antonymes/hyperonymes/hyponymes/etc.).
Il est possible de réutiliser tout ou partie des lexèmes dans les différentes éditions du Wiktionnaire ; voir par exemple bn:হৃদয় ou bn:computer (plus de 250 pages utilisent ce modèle, via un module en Lua).
Enfin, Wikifonctions – le tout dernier projet Wikimédia, une bibliothèque collaborative de fonctions informatiques – a accès aux lexèmes. Ce qui permet de créer des fonctions générant ou analysant des phrases (le but de la Wikipédia abstraite) ou – qui sait un jour peut-être – être utilisé sur le Wiktionnaire, par exemple pour les tables de conjugaisons ou les tableaux de déclinaisons.
Tout cela peut sembler impressionnant ou encore un peu balbutiant mais cela devrait fortement se développer à l’avenir. N’hésitez pas à partager vos idées, vos commentaires et à faire des propositions.Les thésaurus de la semaine de février
Ces nouvelles suggestions hebdomadaires, affichées sur la page d’accueil, ont été proposées par Noé, Hildepont et Harmonide. Le thésaurus de la vannerie a été créé par Stephane8888 !
- Semaine 6 (2 au 8 février 2026) : vieux
- Semaine 7 (9 au 15 février 2026) : vannerie
- Semaine 8 (16 au 22 février 2026) : sacrifice
- Semaine 9 (23 février au 1er mars 2026) : pinceau
Semaines suivantes
Les collaborations de la semaine de février
Ces suggestions, affichées sur la page d’accueil, ont été proposées par Lyokoï et Noé. Merci de leurs contributions aux personnes qui ont créé de nouvelles entrées : Basnormand, Bercours, FoeNyx, Lepticed7, Sayoxime et une personne sans compte !
Semaine 06 (2 au 8 février 2026)

Vous avez une manie ? Peut-être que vous pourriez décrire celles-ci : matrimoniomanie, wagnéromanie, byzantinomanie, balletomanie, capromanie ou encore la cynomanie !
Semaine 07 (9 au 15 février 2026)

Chocolatons-nous assez ? Voici quelques ajouts à croquer : chocolat ruby, chocolat hollandais, chocolat viennois, chocolat grand cru, bonbon de chocolat et n’oubliez d’offrir une boîte de chocolat autour de vous ! ;)
Semaine 08 (16 au 22 février 2026)

Plein de super-mots ! les superantigènes, les superastéridées, le superbenzène, la superbulle, le supercondensateur, le superœuf !
Semaine 09 (23 février au 1er mars 2026)

Tombez les masques ! Lequel aurez-vous dans les mains ? Un masque de combat, un masque de sport ou un masque de beauté ? Peut-être un masque funéraire, un masque mortuaire, un masque chamanique ou encore un masque de honte ? Ou alors un masque de carnaval ? Un masque de théâtre ? Levons le masque !
Semaines suivantes
La collaboration du mois de février
Ce mois-ci, Noé propose de réunir des exemples dans l’ordre alphabétique !
Janvier
Cette démarche collective a permis l’enrichissement de 247 entrées (en moyenne, 8,8 par jour) principalement grâce à l’engagement tout au long du mois d’Harmonide et de Fagairolles 34. Les autres ont contribué plus ponctuellement : Bercours, Bpierreb, Lyokoï, Noé, Romainbehar, Sayoxime et Thomas le numéro 24 !
Mois suivant
Un bispire (Bispira volutacornis) photographié par Matthieu Sontag.
Courrier du lectorat
Noé, C'est un bon numéro.
Challwa (discussion) 14 mars 2026 à 17:44 (UTC)
Anciens numéros
- 2015 : avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2016 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2017 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2018 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2019 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2020 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2021 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2022 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2023 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2024 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2025 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2026 : janvier, février, brouillon du prochain numéro