Wiktionnaire:Actualités/101-août-2023
Actualités du Wiktionnaire
Wiktionnaire:Actualités est un journal mensuel sur le Wiktionnaire, les dictionnaires et les mots. Il est publié en ligne depuis avril 2015. Son écriture est ouverte à toutes les bonnes volontés. Vous pouvez recevoir un avis lors de la publication des prochains numéros, consulter les anciens numéros et participer au brouillon de la prochaine édition. Vous pouvez lire aussi les Regards sur l’actualité de la Wikimedia. Pour les commentaires, critiques ou suggestions, voir la page de discussion.
Brèves d’ici
- CKali et Richaringan rejoignent la patrouille, pour relire les nouvelles contributions au Wiktionnaire.
- Pamputt propose une discussion sur la présence de définitions semi-automatisées dont le code demeure présent dans les pages à la place d’un texte rédigé. Technique surtout utilisée pour les formes conjuguées des verbes, elle présente la difficulté de ne pas permettre une modification ultérieure simple.
- Scriptance engage un débat sur la connaissance située, proposant d’indiquer plus clairement la nature des références utilisées, en présentant davantage l’Académie française notamment.
- Noé a attiré l’attention sur la page Convention:Notes qui présente les conventions sur les notes rédigées dans le Wiktionnaire, une page rédigée en décembre 2021 et améliorée à ce mois.
- Lepticed7 soulève la question de la présence de commandes informatiques comme entrées dans le Wiktionnaire.
- Darmo117 et Lepticed7 ont procédé à un nettoyage des indications de langues sur les pages utilisateur. Les déclarations volontaires permettent de connaître les langues connues et maîtrisées, facilitant les discussions.
- Maëlan s’est lancé dans un chantier d’exportation du contenu du Wiktionnaire qui l’amène à détecter des problèmes dans les indications de prononciation. La présentation publique de son outil a permis d’identifier divers problèmes, qui sont en cours de résolution par une demi-douzaine de volontaires et sont venus améliorer la page d’aide sur la notation de la prononciation.
- Le Wiktionnaire en pa’o est sorti de l’incubateur le 16 août dernier. Il s’agit d’une langue sino-tibétaine parlée par 1,5 million de personnes en Birmanie.
Relier (sémantiquement) les points
Dans le précédent numéro des Actualités, j’ai évoqué des phrases qui provoquent des confusions sémantiques. Dans cette chronique-ci, je propose des phrases qui induisent, le plus souvent, le cerveau à relier les points. Voici quelques exemples :
- La vieille planche sur le tas.
- Le grand lit au carré.
- Le grand manque d’enthousiasme.
- Le saint siège à Rome.
- Le vieux moule à terre.
Régulièrement, les gens sont incapables de reconnaître qu’il s'agit de phrases complètes (sujet-verbe-complément). Croyant lire des phrases incomplètes, leur cerveau comble les « trous ». Par exemple, mon cerveau pourrait comprendre :
- [J'ai jeté] La vieille planche sur le tas.
- [Le caporal a montré comment faire] Le grand lit au carré.
- Le grand manque d’enthousiasme [de Géo Trouvetou est évident].
- Le saint siège [se trouve] à Rome.
- Le vieux moule à terre [est rouillé].
J’ai comblé les « trous » à partir de mon expérience. Votre cerveau créera des alternatives valables et compréhensibles. L’action de combler les « trous » est un processus cognitif normal puisque l’immense majorité d’entre nous a été formée à dégager du sens des informations auxquelles nous sommes exposées. Si vous n’êtes pas convaincu de ce que j’avance, je vous invite à lire la page Wikipédia Système 1 / Système 2 : Les deux vitesses de la pensée, particulièrement les chapitres « Normes, surprises et causes » et « Mécanique des jugements ».
Une rapide analyse de chaque phrase montre que le deuxième mot est à la fois adjectif et nom commun, alors que le troisième est à la fois nom commun et verbe conjugué. En utilisant PetScan, j’ai découvert que plus de 12 500 mots sont à la fois adjectifs et noms communs en français (requête PetScan 18544732). Je peux trouver tous les noms communs qui sont aussi des verbes conjugués, soit plus de 7 200 (requête PetScan 18544739). Le nombre de phrases possibles dépasse 90 millions (12 500 × 7 200). Il faut étudier les deux listes pour créer des phrases sensées. Je calcule à la louche qu’il y a probablement des milliers de phrases de ce type en français qui font du sens après analyse.Brèves d’ailleurs
- La Vitrine linguistique qui regroupe le Grand dictionnaire terminologique et la Banque de dépannage linguistique de l’Office québécois à la langue française met en ligne un glossaire des termes de métalangage, avec d’expliquer près de 300 mots utilisées pour l’explication des entrées de son dictionnaire.
- Laetitia Chicoine offre un témoignage de son expérience de la formation en linguistique qu’elle suit à l’université Sherbrooke.
- Publication du n° 122 des Cahiers de lexicologie sur le thème « Dictionnaires, ressources lexicales et didactique des langues ». Parmi les différents articles, Chiara Molinari mentionne l’utilisation du Wiktionnaire au sein de la classe d’apprentissage du français en Italie, s’intéressant aux ressources de la lexicographie collaborative.
- Massinissa Garaoun publie un article sur le hawəssəŠ dans la revue de sociolinguistique Glottopol. Il s’agit d’un cryptolecte des minorités de genre et de sexualité du Nord-ouest marocain qui emprunte à plusieurs langues. Un lexique figure en annexe à l’article.
- Et si on fouillait dans les actes des conférences universitaires Traitement automatique des langues naturelles de ces 20 dernières années afin d’observer quelles ressources lexicales sont les plus souvent citées ? C’est la démarche explorée par Hee-Soo Choi, Karën Fort, Bruno Guillaume et Mathieu Constant dans un article universitaire publié en ligne. Le Wiktionnaire n’est pas considéré comme une ressource lexicale créée par des universitaires dans un but d’études linguistiques, et n’apparaît donc pas dans le classement. La conclusion explore la possibilité d’établir des critères afin d’être davantage réutilisé et cité, sans parvenir à les proposer à ce stade. À suivre !
- Le français, langue de Molière ? Existe-t-il des périphrases pour le français québécois ? C’est ce qu’explore Benoît Malançon dans un article sur la langue de. Le même auteur s’est essayé à un ambitieux tour d’horizon du vocabulaire du baseball !
- Alireza Noruzi publie un article de bibliométrie sur la mention du projet Wiktionary dans les publications universitaires. Il note entre 120 et 160 citations par an sur la décennie écoulée, surtout dans les domaines de l’informatique, des sciences humaines et sociales. La version anglophone est la plus citée. Cet article a été identifié dans l’Infolettre WikiL@b Volume 1, numéro 6 d’août 2023 publiée par trois wikimédiens et wikimédiennes en résidence.
À voir ou écouter
Quelques émissions audio ou vidéo sur la lexicographie, la linguistique et la langue française sorties ou découvertes ce mois-ci.
- Quatre jeunes jouent à une variante de jeu du dictionnaire dans laquelle le mot proposé est peut-être vrai, peut-être inventé.
- Débat de midi à la radio France Inter autour de la question de la baisse du niveau de français à l’école, avec Aurore Ponsonnet, Christophe Benzitoun et Louise Tourret.
- Harrison Holt, de la chaîne YouTube The Generalist Papers, propose une chronique en anglais sur 7 lettres disparues dans l’alphabet de l’anglais.
- Rob Watts, de la chaîne YouTube RobWords, publie une vidéo en anglais sur les noms de villes moches, principalement en Angleterre et aux États-Unis, avec un top mondial qui inclut à son sommet un village de France !
- Erica Brozovsky, de la chaîne YouTube Otherwords, propose une vidéo en anglais sur les différences de communication selon les modalités oral/écrit et synchrone/asynchrone.
- La chaîne YouTube anglophone de Geoff Lindsey n’a pas encore été présentée dans les Actualités, alors qu’elle propose près de cinquante vidéos explicatives sur la linguistique et en particulier sur la phonétique. La plus récente porte sur le phénomène de la voix craquée (ou laryngalisation).
Statistiques
- Du 20 juillet 2023 au 20 août 2023
+ 37 606 entrées et 242 langues dont le nombre d’entrées a été modifié (un record depuis que cette donnée est recensée), pour atteindre 4 942 115 entrées et 1 368 langues avec au moins cinq entrées. Par ailleurs, le Wiktionnaire passe le cap des 5 000 langues répertoriées.
+ 3 552 entrées en français pour atteindre 414 397 lemmes et 649 852 définitions.
Les cinq langues qui ont le plus avancé, outre le français, sont le portugais (+ 24 354 entrées), le same du Nord (+ 2 889 entrées), l’allemand (+ 2 379 entrées), le breton (+ 720 entrées) et l’occitan (+ 671 entrées).
Les nouvelles langues sont : le kikaï (+25), le moyen okinawaïen (+4), le chinois archaïque (+3), le naukan (+2), le kwa’ (+1), le palaung ruching (+1), le jeng (+1), le pong (+1), le serbo-croate (+1), le swo (+1), le tho (+1) et le tai don (+1).
+ 6 483 citations ou exemples en français pour atteindre 596 700 pour les entrées en français, et 292 654 pour les entrées d’autres langues (+1 433).
+ 458 médias d’illustrations (images et vidéos) dans les pages principales du Wiktionnaire, pour atteindre 74 815.
- Du 31 juillet au 31 août 2023
+ 4 375 sections de langue contenant au moins une prononciation audio (dont 489 pour le français) pour atteindre 496 638 sections de langue contenant au moins une prononciation audio pour 164 langues (dont 165 113 pour le français).
+ 2 nouveaux thésaurus ce mois-ci, le total est de 1 174 thésaurus dans 74 langues dont 856 thésaurus en langue française. Les nouveaux thésaurus sont pour l’hallucination en français par Noé et l’autisme en anglais par CKali.
Pas de nouveaux domaines sémantiques en français ce mois-ci.
Wikiscan et Wikistats donnent chaque mois accès à beaucoup de mesures, dont la liste des pages les plus consultées et des pages modifiées par le plus de personnes.
+ 20 mots créés sur les 31 proposés dans les Mots du jour ! Merci à Bercours et Bpierreb !
Les collaborations de la semaine d’août
Ces suggestions, affichées sur la page d’accueil, ont été proposées par Noé. Merci de leurs contributions aux personnes qui ont créé de nouvelles entrées : Bercours, Exilexi et Rectrice Argentée !
Semaine 31 (31 juillet au 6 août 2023)
Vous prendrez bien une petite mousse ? Dicrane en balai , frullane dilatée , hylocomie brillante , pellie épiphylle , pleurozie dorée (ou hypne dorée) , thuidie à feuilles de tamaris
Semaine 32 (7 au 13 août 2023)
Connaissez-vous les pompes à chaleur et les différents concepts qui s’y rapportent ? Quelques termes manquants au Wiktionnaire : énergie thermique, thermofrigopompe, aquathermie, refroidissement thermoélectrique, ventilo-convecteur.
Semaine 33 (14 au 20 août 2023)
Et si on mangeait des plats à base de soja ? De nombreuses recettes viennent d’Asie : dubu gimchi, kongguksu, sundubu jjigae, tahu goreng, yong tau foo.
Semaine 34 (21 au 27 août 2023)
Mettons-nous en jambe et pratiquons un peu de sport : marche afghane, marche ultra-légère, randonnée asine, course en montagne, skyrunning ou kilomètre vertical !
Semaine 35 (28 août au 3 septembre 2023)
Connaissez-vous les engins forestiers ? Abatteuse billonneuse, débusqueur à grue, débardeur à câble, araseuse d’accotements, élévateur de fagot.
Semaines suivantes
Noms scientifiques
Les noms scientifiques sont-ils des mots de français ? Ce terme englobe les noms uninominaux (par exemple Homalodisca), les épithètes spécifiques (vitripennis) et les noms binomiaux (Homalodisca vitripennis). Ils sont utilisés pour décrire le vivant dans de nombreux contextes : animaux, plantes, champignons, etc.
Ces termes apparaissent dans des textes rédigés en français et peuvent être prononcés par des francophones, mais cela suffit-il à en faire des mots de français ? Les autres noms qui désignent ces réalités sont-ils des synonymes ou des traductions ? Depuis quelle langue alors ?
Que ce soit pour leur créer des entrées dédiées ou pour s’y référer dans d’autres entrées, les noms scientifiques ont dû trouver leur place au sein du Wiktionnaire comme au sein des dictionnaires traditionnels. Il n’existe cependant pas vraiment de tradition lexicographique à les décrire au sein d’un dictionnaire multilingue comme l’est le Wiktionnaire et la stratégie mise en place au sein du projet a été forcément innovante.
Dans le Wiktionnaire, les noms scientifiques disposent d’entrées spécifiques en conventions internationales avec la catégorie Noms scientifiques Ce ne sont donc pas des entrées de français et ces termes sont indiqués comme traductions plutôt que comme synonymes. Les noms uninominaux et binominaux sont regroupés dans la même catégorie, et il existe également la catégorie Épithètes spécifiques qui présente peu d’entrées pour l’instant.
La description lexicographique est-elle la même que la description scientifique ? Quel est l’intérêt et la plus-value d’avoir ces entrées dans le Wiktionnaire ? Est-ce que les gens les recherchent dans un dictionnaire ou plutôt dans des bases de données spécialisées rédigées par des scientifiques ?
Ces questions se sont posées à divers reprises au cours de l’histoire du Wiktionnaire mais n’ont été que peu documentées et aucune page d’aide ne rapporte comment traiter au mieux ce sujet. Un chantier à explorer pour faire le lien entre lexicographie et science, et de nombreuses nouvelles entrées sont à créer !Anecdote linguistique
Courrier du lectorat
Anecdote linguistique : Sujet intéressant. Je ne peux m'empêcher de faire un parallèle avec les conventions de salutations parmi l'ancienne aristocratie française quand il s'agissait d'une femme ou d'un homme (le baise-main plutôt que la poignée de main par exemple), ou encore des vêtements portés aujourd'hui selon le sexe de la personne (en Occident, les femmes ont adopté plusieurs types de vêtements portés par les hommes : pantalons, chemises à boutons, vestons, casquettes..., mais l'inverse est peu fréquent : robes, jupes, strings...). Cantons-de-l'Est (discussion) 1 septembre 2023 à 15:21 (UTC)
Anciens numéros
- 2015 : avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2016 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2017 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2018 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2019 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2020 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2021 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2022 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2023 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2024 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, brouillon du prochain numéro