Discussion Wiktionnaire:Critères d’acceptabilité des entrées

Définition, traduction, prononciation, anagramme et synonyme sur le dictionnaire libre Wiktionnaire.
Sauter à la navigation Sauter à la recherche

Attestations[modifier le wikicode]

2 sources[modifier le wikicode]

"Les mots nouveaux, très récents, qui n'ont pas été attestés par des dictionnaires, mais qui sont pourtant très courant, ne peuvent être acceptés que si l'on trouve au moins 2 sources correctes."

J'ai le sentiment qu'il faudrait préciser ces critères: les journaux ayant un peu tendance à se copier l'un-l'autre, il est facile de trouver deux sources pour un néologisme qui sera completement oublié quelques semaines plus tard. Peut être faudrait il ajouter des critères plus stricts: par exemple au moins six mois d'écart entre les deux attestations du mot et une réelle indépendance des sources (pas le même auteur, pas l'une qui ne fait que citer l'autre..) Ske
Si on avait une régle d'attente de plusieurs mois, on risquerait de ne pas mettre un mot au moment où sa présence est justement la plus utile aux lecteurs, ce qui serait un comble... Même dans les dictionnaires papier à édition annuelle, il est bon de ne pas attendre, quitte à supprimer le mot qu'on vient de rajouter dans l'édition suivante. Pour nous, il est toujours bon de le garder, même quand il n'est plus utilisé, car c'est un témoignage sur l'histoire de la langue. Par contre, une réelle indépendance des sources est effectivement nécessaire quand il s'agit de compter les attestations. Lmaltier 25 mai 2006 à 15:18 (UTC)

Autres wikis en référence[modifier le wikicode]

Il a été rajouté dans l'article que les Wiktionnaires en d'autres langues et Wikipédia peuvent servir de références : je ne suis pas d'accord. De par leur nature, les articles wiki ont autant de valeur de référence que des forums ou des listes de discussion et ne peuvent donc pas être utilisés pour justifier l'existence d'un mot ou d'une acception. - Dakdada (discuter) 23 mai 2006 à 15:47 (UTC)

Mon idée n'était pas l'apparition du mot dans un article, mais si ce mot là est le titre d'un article. Et je pensais plus précisément à une apparition dans plusieurs wikipédias de différentes langues. Avec toujours le même critère d'apparition dans le temps. Je pense notamment que vu la notion d'interwiki, un article qui apparaît dans un wiktionnaire étranger peut apparaître dans le wiktionnaire français. Nous pouvons avoir une certaine crédibilité quant à l'acceptation de mots en français, mais pour ce qui est des mots en langue étrangère, nous sommes un peu moins compétent. --JR disc 26 mai 2006 à 10:59 (UTC)

Proposition[modifier le wikicode]

Voici une proposition qui tente d'être la plus simple possible : 3 grands principes. Attention : elle ne préjuge pas du contenu des articles (certaines catégories de mots peuvent avoir à être traitées spécialement, mais c'est un autre problème).

  1. Tous les mots existants de toutes les langues (vivantes ou mortes), sous toutes leurs formes, sont admis, même les mots rares (sauf les mots purement personnels, par exemple dans le cas des surnoms et pseudonymes, et les orthographes très minoritaires, quand on peut les considérer comme des fautes).
    confuses, Confucius, SNCF et Stendhal sont admis, mais pas Darkdadaah.
    raccourci est admis, mais pas son contraire rallongis, car c'est un mot que j'ai inventé et qui ne s'est pas répandu, ni rakourssi.
  2. En cas de contestation sur l'existence d'un mot dans une langue donnée, la preuve de cette existence doit être fournie dans un délai d'un mois pour éviter la suppression : au moins deux attestations, orales ou écrites, mais à la fois vérifiables, sérieuses, non liées au créateur du mot et indépendantes entre elles. Pour les mots essentiellement oraux, des témoignages de contributeurs réguliers du Wiktionnaire sur l'existence du mot peuvent suffire.
    Pour les mots rares dans les langues étrangères, j'opterais pour une solution faisant appel à l'interwiki. Nous faisons partie d'un grand projet.
    Effectivement, demander leur avis aux contibuteurs du wiktionnaire de la langue (quand il existe) est une bonne idée. ce peut être un des moyens possibles de prouver l'existence du mot. Lmaltier 26 mai 2006 à 18:03 (UTC).
  3. Les locutions ne sont admises que dans la mesure où l'article peut être utile aux lecteurs (pour des raisons autres qu'encyclopédiques). C'est en particulier le cas quand on ne peut pas bien comprendre leur sens en partant uniquement du sens de chacun de leurs composants, ou quand ils entrent dans une catégorie dont la plupart des noms sont des mots simples.
    chien de prairie, chemin de fer, Le Havre et fier comme Artaban sont admis, mais pas Société nationale des chemins de fer français ni Jacques Chirac, car toutes les informations linguistiques concernant ce nom peuvent être trouvées à Jacques ou à Chirac, et l'article ne peut donc être utile que pour des raisons encyclopédiques. Le football en salle est aussi accepté, car c'est un nom de sport à part entière (un sport qui a ses propres règles), et qui n'exprime donc pas seulement qu'on fait du football dans une salle.
    Sur Jacques Chirac, il pourraît-être intéressant de savoir comment cela s'écrit en japonais, ou en russe, ces données sont elles encyclopédiques ? Savoir qu'on appellait que Charles de Gaulle égal le général De Gaulle. Ou que le Grand Timonnier égal Mao Zedong ?
    Pour savoir comment ça s'écrit en russe, il faut aller voir séparément Jacques et Chirac, et rassembler les deux. Si par hasard, il y a des langues où Jacques Chirac bénéficie d'un mot spécial (par exemple un idéogramme particulier), il s'agit d'une information à préciser, mais on pourrait plutôt la mettre à Chirac (cas particulier de traduction dans son cas). De la même façon, on peut aussi créer un article Grand Timonier, et rappeler cette locution dans l'article Mao. Mais la règle est utile, car elle permet d'éviter que chacun veuille mettre son prénom+nom... Lmaltier 26 mai 2006 à 17:49 (UTC)
    Donc ça fait un cas particulier qui dit qu'on n'accepte pas les locutions prénom + nom car l'information linguistique se trouvera dans le prénom et dans le nom.--JR disc 26 mai 2006 à 18:26 (UTC)

Ces principes visent à être à la fois très rigoureux et très souples, parce qu'on ne peut pas prévoir tous les cas particuliers... Pourquoi ne pas discuter séparément sur chacun de ces trois principes, les améliorer éventuellement, puis voter sur chacun ? Il est temps de régler la question, et cela permettra de se concentrer sur quel contenu donner aux articles, ce qui est un problème beaucoup plus difficile dans certains cas. Lmaltier 25 mai 2006 à 16:22 (UTC)

Discussion[modifier le wikicode]

Je suis d'accord sur le principe des 3 règles. L'idée que je retrouve en partie dans les propositions de frl et lmaltier, c'est sur le contenu. Un article peut-être rejeté s'il ne comporte pas d'informations linguistique, comme la prononciation, ou l'étymologie. Je n'ai pas envie que le wiktionnaire se retrouve avec des milliers d'ébauche de noms de village ne contenant même pas la prononciation, ou de prénoms dans toutes les langues. Il est important, à mon avis de faire un article de qualité pour ce genre d'article afin de montrer ce qu'on attend de ce genre d'articles. Pareil pour les locutions. --JR disc 26 mai 2006 à 11:22 (UTC)

Il ne faudrait pas exiger que tous les articles concernant les noms propres soient des articles de qualité, alors qu'énormément d'articles (par exemple des articles importés) ne contiennent qu'une courte définition en tout et pour tout. Ce n'est pas gênant, car ils seront complétés peu à peu, et ils sont déjà utiles en l'état. Je ne vois pas qui irait mettre des milliers d'ébauches de noms de village (sauf par robot, mais on peut demander de ne pas le faire). Il n'y a donc pas de risque, et le Wiktionary accepte ce genre de chose, et n'est pas submergé, malgré le grand nombre de contributeurs. Et même si c'était le cas, ce ne serait pas vraiment un problème. Le plus important, c'est de ne pas décourager un contributeur qui met le nom de son village, et d'avoir des règles d'admissibilité simples, objectives et cohérentes, donc les mêmes pour tous les types de mot. Lmaltier 26 mai 2006 à 17:49 (UTC)

Je parlais juste de quelques exemples d'article de qualité, pour un prénom, un nom de famille, une ville, un pays afin de servir d'exemples pour les futurs articles. Même si les règles sont simples objectives et cohérentes, un petit exemple ne peut pas faire de mal. --JR disc 26 mai 2006 à 18:25 (UTC)


Pour le nom de personne, je crois que Wikipédia peut fournir les alternatives, en général je crois qu'on devrait éviter Mao Zedong mais garder Grand Timonnier et garder Mao et Zedong avec des liens vers WP. --/moyogo/ ⁽ᵈⁱˢᶜᵘᵗᵉʳ⁾

Concernant les noms de personnes donc, il semble que l'on soit à peu près d'accord. J'entrevoit deux critères pour limiter un peu l'abus de création du type « je met mon nom » à tout bout de champs :
  1. c'est un nom connu (De Broglie, Einstein), avec lien évident vers les pages d'homonymie de Wikipédia,
  2. et/ou il faut fournir au moins l'étymologie et/ou la prononciation.
Il faudrait aussi voir ce qu'on fait des noms fictifs : Grand Schtroumpf, Sangoku, et tous les noms de héros de manga, BD, et compagnie ? - Dakdada (discuter) 26 mai 2006 à 18:38 (UTC)
Il est difficile de mettre son nom à tout bout de champ : on ne peut le mettre qu'une fois... Sérieusement, je rappelle qu'il existe des dictionnaires de noms de famille, et que cela intéresse les gens, en particulier pour l'étymologie, mais cela peut aussi être utile pour la prononciation. Faut-il refuser les noms pourtant présents dans ces dictionnaires papier, qui sont à but exclusivement linguistique ? Ce serait paradoxal, quand on veut être universel... Je pense donc qu'il faut au contraire encourager fortement les gens à mettre leur nom de famille, même s'il n'est pas connu, avec sa prononciation (tout le monde connait la prononciation de son nom) et si possible son étymologie, et de ne pas se limiter à leur propre nom...
Pour les héros de romans, films, mangas et autres, le critère d'attestations non liées au créateur du mot peut être utilisé, il est là pour ça, et il permettrait déjà d'éliminer beaucoup de cas litigieux. Deux attestations seulement, est-ce trop peu dans ce cas ? Faudrait-il considérer les attestations trouvées sur les sites de fans ou dans les comptes-rendus d'œuvres comme trop liées au créateur du mot, mais accepter les attestations trouvées dans des livres consacrés à ces œuvres ? Mon idée pour ces mots est qu'il est important de les accepter quand ils font partie de la culture générale, mais cette idée n'est pas évidente à formaliser sans tout compliquer.
En tout cas, merci de ces réactions, je sens qu'on avance. Lmaltier 26 mai 2006 à 19:34 (UTC)
Je suis assez d'accord, il me semble que pour le problème : j'ajoute mon nom, la règle qui prévaut sur Wikipédia, qui est pas d'article personnel tient assez bien aussi. Dans un dictionnaire, je ne dois pas faire un article sur moi, cela me semble une règle évidente, faut-il la rappeler ?
Pour ce qui est de Grand Schtroumpf, il s'agit à mon avis d'un problème qui sort un peu des 3 règles. A priori, il n'y a pas de critères dans les 3 proposés qui permette d'écarter ce genre de terme. Je pense quand même qu'une certaine classification dans les termes devrait être proposée. Quelque chose qui permette au lecteur qui tomberait sur ce mot par hasard de bien comprendre qu'il s'agit d'un personnage de fiction (si la définition est chef du village, qu'il n'aille pas appeler le maire Grand Schtroumpf...). JR disc 29 mai 2006 à 08:18 (UTC)
  • A propos du j'ajoute mon nom, je voudrais proposer : oui, mais sur ma page personnelle. J'ai constaté que plusieurs membres l'avaient fait pour leur pseudo, et bien il suffit de se creer une sous-page pour son nom+prénom et voila. On pourrait éventuellement catégoriser ses sous-pages mais elle apparaitrait clairement comme des pages personnelles.
  • Par rapport aux personnages fictifs il faudrait peut-être créer un modèle spécial pour les noms propres fictifs et un autre pour les noms fictifs tombés dans le langage courant ?
  • Et enfin, pour les noms de personnalités on pourrait penser à créer des pages expliquant que c'est un mot qui n'a pas sa place sur le Wiktionnaire mais qu'il existe une page à ce propos sur Wikipédia ? Eölen (discuter) 30 mai 2006 à 08:38 (UTC)

Bien entendu, il ne faut pas faire un article sur soi, mais rien n'empêche de faire un article sur son prénom, ou sur son nom de famille, tout comme sur le nom de son pays, le nom qui désigne son métier, la race de son chien, le gentilé de sa ville, etc. Après tout, c'est sur ces mots qu'on est le plus susceptible de connaître des données linguistiques intéressantes. Le tout est de pas s'y citer, et de ne pas y parler de soi d'aucune façon. Lmaltier 31 mai 2006 à 17:36 (UTC)

Oui, en fait on n'a qu'à considérer les prénoms et patronymes que d'un point de vue linguistique. La définition serait alors plutôt une description indiquant la localisation du nom (lieu, temps), son appartenance à une classe social particulière, etc. Tout ce qui est porteurs de ces noms est par contre encyclopédique, ce qui suppose un lien vers les pages d'homonymie de Wikipédia. Il suffirait donc de souligner la distinction dictionnaire/encyclopédie.
Bien entendu, pour certains termes qui s'appliquent uniquement à une personne particulière, cela fera partie de la description : Zizou ou Charlemagne par exemple (au même titre que grand Timonier). - Dakdada (discuter) 31 mai 2006 à 18:00 (UTC)

Vote[modifier le wikicode]

Je pense qu'on est arrivé à un certain consensus, et qu'il faudra penser à passer à un vote sur la wikidémie. Le bon moyen, de procéder serait de refaire la page en fonction des critères que l'on a défini, puis de passer à la phase de vote. JR disc 30 mai 2006 à 07:20 (UTC)

Je ne pense pas qu'on ait suffisamment discuté pour proposer des « règles » claires. Je préfèrerais qu'on attende que les choses soient plus développées avant de songer à un vote pour « officialiser » tout ça. - Dakdada (discuter) 30 mai 2006 à 10:45 (UTC)
Qu'entends tu par plus développées ? Je pense qu'on recherche la simplicité. Comme la discussion semble calmée, et même si proposer les choses en l'état est prématuré, je pense qu'il faut savoir sur quoi on va voter, c'est pour ça que je lance le débat.
Il y a selon moins plusieurs point qui peuvent faire débat:
  • Le fait qu'il y aie des règles,
  • le fait qu'elles soient en nombre limité,
  • Chacune des règles dans l'esprit,
  • Chacune des règles dans la formulation,
  • Comment on présente ces règles...
D'autre part, il s'agit d'une décision importante, il ne faut donc rien précipiter, mais il ne faudrait pas non plus enterrer cette discussion... JR disc 30 mai 2006 à 11:43 (UTC)
Euh pardon si je me suis mal exprimé alors :-( je vais donner un exemple : je pense qu'à l'issu de la discussion sur les noms propres, on arrivera à extraire quelques règles générales, du type : « Les termes inventés n'ont pas leur place sur le Wiktionnaire ». On aurait donc une liste de règles assez simples de ce type. Cependant, ces règles devront être accompagnées d'explications et d'exemples pour bien expliquer en quoi la règle consiste. L'exemple que j'ai pris, pour illustrer cela, exige que l'on donne une définition assez précise de terme inventé (puisque tous les termes sont inventés de toute façon), ainsi que des exemples de termes acceptés et de termes rejetés selon cette règle (comme l'a fait Lmaltier à ce sujet plus haut). Donc une règle c'est une phrase simple + une explication + des exemples. C'est cela que je veux dire par développer :-) Et je pense qu'on est sur la bonne voie... - Dakdada (discuter) 30 mai 2006 à 13:07 (UTC)

Formes et fonds sont liés intimement. J'ai l'impression qu'il va être difficile d'avancer, je propose ça comme base de travail Wiktionnaire:Critères d'acceptation des articles/Proposition 1, avec dans l'idée qu'on peut aussi bien partir d'une autre base si on sent que ça n'avance pas. Simplement, cette page de discussion n'est pas idéale pour travailler correctement. JR disc 5 juin 2006 à 16:28 (UTC)

Objet du vote[modifier le wikicode]

Toute cette discussion a bien avancé et l'on voit le but. Toutefois, sommes ici dans la même situation que le législateur face à l'Administration :

  • La loi, telle qu'édictée par Lmaltier est assez simple et compréhensible ;

Ensuite pour chaque catégorie de mot et en particulier pour les diverses catégories de noms propres ;

  • oronymes (noms de motagnes, de fleuves, de plaines, de reliefs géographiques) ;
  • toponymes (noms de villes, de villages, de lieux-dits, de lieux habités divers) ;
  • prénoms ;
  • noms de famille ;
  • personnages historiques ou célèbres ;
  • pseudonymes de personnages historiques ou célèbres ;
  • ...

il faut être plus précis et édicter les "décrets d'applications".

Donc, démarche en trois temps :

  1. Édicter et rédiger de façon aussi simple que possible les termes de la loi ;
  2. lister les domaines d'application ;
  3. édicter les décrets d'application propre à chaque domaine.
    Gilles MAIRET 7 juillet 2006 à 22:21 (UTC)

Morceau de pain[modifier le wikicode]

Après en avoir discuté avec JR qui l'avait proposé, j'ai supprimé morceau de pain comme mot du jour pour le 12 juin car cela ne me semble pas une locution nominale, pas plus que morceau de fromage, morceau de verre ou morceau d'anthologie. J'ai proposé à la place cylindrée car je venais de retoucher l'article vélomoteur. Pierre 30 mai 2006 à 06:14 (UTC)

Ce ne sont pas des locutions effectivement mais il faut tout de même indiquer quelque part que "morceau" se construit avec "de". --frl 30 mai 2006 à 09:38 (UTC)
Une petite remarque : je pense que, contrairement à morceau de pain, morceau d’anthologie a sa place dans le Wiktionnaire. Mais il serait bon d'améliorer l'article morceau pour clarifier tout ça. Lmaltier 5 juin 2006 à 16:38 (UTC)
Quelqu'un pourrait-il éclaircir le statut grammatical de constructions telles que morceau de ou bien espèce de ?
Gilles MAIRET 6 juin 2006 à 04:33 (UTC)
Il s'agit de ce que la grammaire traditionnelle appelle complément du nom. Le sens même de mots comme morceau ou part ou fraction, qui évoquent l'idée de partage, nécessite bien souvent que l'on précise ce que l'on partage. De même espèce, genre, sorte désignent des sous-catégories et demandent qu'on précise la catégorie plus générale. Dans le cas particulier du mot espèce employé dans des expressions comme une espèce de c'est finalement espèce de qui est ressenti comme qualificatif du complément du nom qui suit, d'où l'attraction du genre du complément sur le mot complété dans le langage courant : un espèce de crétin et non une espèce. Ainsi le mycologue qui dit une espèce de champignon ne doute pas qu'il s'agit d'un champignon, dont il pourrait préciser l'espèce mais l'on entendra dire un espèce de champignon pour signifier quelque chose qui ressemble à un champignon mais qui n'en est peut-être pas un. Pierre 6 juin 2006 à 06:26 (UTC)
PS. Ne pas prendre l'expression morceau de roi au pied de la lettre, sauf en ce qui concerne Louis XVI.

Nouvelles propositions[modifier le wikicode]

Suite à la dicussion dans Wiktionnaire:Wikidémie/Noms propres, je voudrais essayer de proposer à nouveau quelques règles aussi simples que possible (à compléter par des "décrets d'application" pour expliquer comment elles s'appliquent à des cas particuliers) :

Principes "constitutionnels"

1. Le principe de l'existence d'un article est accepté si on peut justifier cette existence d'un point de vue linguistique.
2. La création effective est acceptée si l'article créé a un contenu à la fois correct et pertinent du point de vue du Wiktionnaire.

Lois

1.1 Tous les mots de toutes les langues, vivantes ou mortes, sont acceptés, y compris les mots récents, ainsi que les locutions dont la présence est justifiable linguistiquement.
1.2 En cas de contestation, il faut vérifier que l'entrée est bien attestée. Commentaire : Le "bien" est à interpréter plus ou moins largement selon les cas : le nombre d'attestations (indépendantes entre elles) nécessaires pourrait varier de 1 (pour un mot très ancien utilisé par un auteur connu, par exemple Rabelais, pour lequel on ne peut guère s'attendre à trouver de nouvelles attestations) à au moins quelques-unes (cas normal), ou plus si cela semble nécessaire pour éviter les abus (par exemple pour les marques). Voir les "décrets d'application".
1.3 Les attestations liées au créateur du mot ne sont pas prises en compte. Par exception, les recommandations ayant un caractère officiel sont toujours acceptées (pour information).
2.1 Si un article est créé avec un contenu non pertinent (en particulier encyclopédique), il ne peut être conservé que si la partie non pertinente est supprimée.
2.1 Mis à part le fait qu'il y ait un contenu exact et pertinent, aucun contenu minimal n'est fixé, car l'article peut toujours être complété.

J'ai numéroté pour faciliter un vote : les principes sont suffisamment généraux, je pense, pour qu'on puisse déjà voter dessus, et n'ont volontairement pas d'exemples (c'est le rôle des "décrets d'application", à discuter ensuite). Si on se mettait d'accord là-dessus, et je pense que c'est possible, ce serait déjà une bonne base pour la suite, car on pourrait discuter les cas particuliers (titres d'oeuvres, par exemple) en partant de ces principes. Je propose que la discussion se fasse par l'intermédiaire d'explications de vote (surtout en cas de vote négatif). Lmaltier 3 septembre 2006 à 20:39 (UTC)

Vote[modifier le wikicode]

Vote ouvert le :
3 septembre
jusqu’au :
17 septembre.

Sujet : Accepter les principes fondamentaux proposés ci-dessus par Lmaltier sur l'acceptation des articles dans le Wiktionnaire.

Le vote a été lancé le 3, mais comme il n'a pas été annoncé et que le vote a réellement commencé le 9, j'ai rallongé d'une semaine. - Dakdada (discuter) 10 septembre 2006 à 17:03 (UTC)

Pour[modifier le wikicode]

  1. Pour : C’est une base consensuelle. Toute la problématique est dans le justifiable linguistiquement. C'est en cela que les noms propres posent problème : appartiennent-ils à une langue ? Sont-ils connus, compréhensibles par le grand nombre, ou alors au sein d’un domaine (ex: Médecine, Sports, …). Stephane8888 9 septembre 2006 à 20:58 (UTC)
  2. Pour : Merci à Lmaltier pour son travail de conceptualisation. Le travail n'est pas terminé pour autant : il convient de définir ce qu'est "l'existence d'un point de vue linguistique". Le tableau que j'avais bâti à ce propos, selon les types de noms propres, visait à préciser les catégories de mots pour lesquelle, par nature, une "information linguistiquement pertinente" était possible (même si non disponible), et celles pour lesquelles, par nature, il ne pouvait exister d'information linguistique pertinente. Ces règles restent disponible et sont à mettre en œuvre, comme décret d'application, dans le cadre des lois proposées par Lmaltier. Gilles MAIRET 9 septembre 2006 à 22:31 (UTC)
    PS. Le terme "groupe de mots" utilisé en place de "locution" me gène. Je rappelle la définition suivante, d'une biblique simplicité me semble-t-il, dont je ne suis pas l'auteur : on appelle "locution" un groupe de mots dont le sens ne se déduit pas de l'analyse et doit être appris au même titre qu'un mot simple.
    Je pense qu'il faut se méfier. Avoir froid semble-t-il se déduit très bien du sens des mots avoir et froid ce n'est donc pas une locution d'après votre définition. Néanmoins, les anglais disent to be cold. Le sens de to be cold se déduit très bien aussi de to be et de cold : ce n'est pas non plus une locution. Mais je pense qu'eu égard à la différence du français et de l'anglais il est bon d'entrer avoir froid et to be cold ne serait-ce que comme syntagme fréquent (pour reprendre l'expression du TLFI) si l'expression de locution ne vous agrée pas. --frl 19 octobre 2006 à 09:55 (UTC)
  3. Pour : J'ai changé groupe de mots pour mettre locution à la place, mais il semble que, si on suit la définition précédente, toutes les locutions doivent être acceptées... La loi 1.1 se déduit du principe 1 pour tous les mots isolés, car il est bien évident que tous les mots isolés doivent pouvoir être écrits (donc connaître leur orthographe est utile), en général être prononcés (donc connaître leur prononciation est utile), qu'ils ont une étymologie, qu'ils s'emploient seulement dans certains cas, en général pour signifier quelque chose, etc. Et tout cela est vrai systématiquement pour tous les mots isolés, y compris les noms propres. C'est pour les noms composés et les groupes de mots qu'il y a plus matière à discussion... Lmaltier 10 septembre 2006 à 06:57 (UTC)
  4. Pour : je ne suis pas sûr que ce soit utile, mais ne faudrait-il pas aussi spécifier (dans les "lois", notamment la 1.1) que les caractères eux-même (en dehors des mots qu'ils forment), les symboles (qui ne sont pas non plus des mots), ou encore les éléments formants (suffixes, préfixes, etc.) et les flexions ont aussi droit à un article ? Bien entendu, le premier "principe constitutionnel" inclus ces cas... Il faudrait au moins montrer que ces éléments-là sont acceptés (quelque part, une page d'exemples peut-être). - Dakdada (discuter) 10 septembre 2006 à 14:29 (UTC) Effectivement, c'est un détail qu'il faudrait rajouter. Mais je ne pense pas que cela pose un problème à qui que soit. Lmaltier 11 septembre 2006 à 17:15 (UTC)
  5. Pour--Bertrand GRONDIN 18 septembre 2006 à 09:08 (UTC)
  6. pour Tibo 21 septembre 2006 à 11:36 (UTC)

Contre[modifier le wikicode]

Autre[modifier le wikicode]

  • Neutre: J'ai du mal à comprendre la finalité de ce vote. En effet, s'il s'agit de lois (constitutionnelles ou non). J'attends avec impatience les décrets d'applications... Va-t-on mettre une police d'acceptabilité? S'agit-il de pouvoir fonder les commentaires que l'on ajoute sur les articles? Est-ce un débat purement philosophique? LBO disc 16 septembre 2006 à 16:12 (UTC)
  • Neutre: les "Principes "constitutionnels"" sont totalement creux. Je préfère le terme recommandations au terme loi, trop ronflant et peu dans l'esprit wikimédien. Enfin ce vote est trop confidentiel.   <STyx @ 22 septembre 2006 à 22:27 (UTC)


Étape suivante[modifier le wikicode]

Personne ne semble s'opposer à ces principes très généraux (mais utiles pour pouvoir aller plus loin - les termes utilisés : lois... s'expliquent par des discussions précédentes). Je propose de créer plusieurs discussions séparées pour guider dans l'application de ces principes dans les cas suivants :

  • verbes pronominaux (ou de façon générale toutes les locutions : se + verbe)
  • mots composés (y compris le cas de mots comme scénariste-réalisateur ou salon-salle à manger-bibliothèque, ou les cas d'utilisation de / dans le même rôle que le tiret)
  • noms de lieux (toponymes...)
  • noms de voies (odonymes)
  • noms de personnes (y compris surnoms)
  • noms de famille (plutôt pour discuter du contenu : langue(s) où les classer...)
  • prénoms
  • noms propres d'animaux
  • noms de héros de fiction (par exemple, j'ai créé Burma en tant que mot français, pour prévenir les éventuelles confusions avec la Birmanie)
  • noms d'oeuvres (livres ou autres) - ça mérite une discussion : en effet, le wiktionnaire italien va jusqu'à accepter les noms d'oeuvres pour avoir la traduction du titre dans d'autres langues, c'est-à-dire le nom sous lequel le livre a été traduit.
  • noms de personnes morales (organismes divers, entreprises...)
  • noms de marques
  • évènements (par exemple Révolution d’Octobre).
  • néologismes (comment juger précisément du caractère indépendant des attestations de néologismes ?)

Lmaltier 15 octobre 2006 à 09:28 (UTC)

Comme les règles ont étés adoptées, il est effectivement intéressant d'avoir des décrets d'applications, cependant, je pense que dans un premier temps la page Critères devrait être remodelée pour prendre en compte l'adoption de ces règles. JR disc 16 octobre 2006 à 08:04 (UTC)

Espagnol[modifier le wikicode]

J'ai déjà parlé des mots en espagnol, le fait que contrairement au français se mettre, en espagnol on écrit ponerse (donc un seul mot). Parfois la différence entre un « mot » et une « locution » est juste une convention individuelle. Mglovesfun 28 mai 2009 à 22:00 (UTC)

Je propose une nouvelle règle pour aider à résoudre certains cas :
  • quand les noms faisant partie d'une certaine catégorie de "choses" sont habituellement des mots, tous les noms entrant sans aucun doute dans cette même catégorie sont aussi acceptés. Par exemple, les noms de pays sont normalement des mots, donc tous les noms de pays sont acceptés. Les noms de sports sont en général des mots, donc natation synchronisée est accepté, car c'est un nom de sport, mais pas football amateur. A l'inverse, les noms de rues (rue de la Pais) ou les noms de personnes (Winston Churchill) ne sont pas considérés comme des mots, de façon générale, donc ils ne sont acceptés que quand ce sont effectivement des mots (par exemple, Champs-Élysées, Canebière ou Charlemagne sont acceptables). Lmaltier 5 aout 2007 à 06:24 (UTC)
On peut appliquer le même genre de principe pour savoir si un mot fait partie de la langue. Les noms de villes de France, par exemple, font partie de la langue française, tous sont donc acceptés. Mais les noms de lieux imaginaires ne font partie de la langue. Ils sont donc refusés, sauf cas particuliers de noms qui sont devenus suffisamment connus pour qu'on puisse considérer qu'ils font partie de la culture générale, donc de la langue, comme Syldavie ou Moulinsart. Lmaltier 5 aout 2007 à 11:18 (UTC)

Verbes pronominaux (vote)[modifier le wikicode]

Salut, ma proposition c'est qu'on accepte les verbes pronominaux uniquement s'ils ont un sens spécial. Par exemple, se laver, non, parce qu'il s'agit de se + laver, mais se passer et se produire oui, parce que dans la phrase « qu'est-ce qu'il se passe là ? » on ne peut pas remplacer 'se' par un autre nom ou pronom, mais dans la phrase « je me lave » on peut mettre n'importe quel nom ou pronom sans changer le sens (au niveau grammatical, au moins).

2è partie de la proposition, c'est d'appliquer ce principe à toutes les langues, surtout en parlant de l'espagnol où ça reste un seul mot (levantar, levantarse). Mglovesfun 18 juin 2009 à 04:55 (UTC)

Moi, il me semble que se laver mérite sa page. A partir du moment où on peut dire que quelque chose est un verbe pronominal (il y en a plusieurs types), c'est bien de l'inclure. La règle ci-dessus pourrait être utilisée pour déterminer quelle est la page principale conseillée, c'est-à-dire que se laver ne serait pas traité en détail, mais renverrait à laver. Dans tous les cas, je pense qu'il est fondamental que ceux qui cherchent au verbe simple (par exemple produire pour se produire) puissent trouver ce qu'ils cherchent. Lmaltier 18 juin 2009 à 05:43 (UTC)
On a déjà pas mal parlé des verbes pronominaux, par ailleurs il existe une page Annexe:Conjugaison française:Verbe pronominal qu'il suffit d'appliquer.--Béotien lambda 18 juin 2009 à 06:28 (UTC)
Je suis partisan de créé une page séparée dès qu'il y a quelque chose à en dire, et de créer la page de conjugaison associée. --Szyx (d) 18 juin 2009 à 11:46 (UTC)
Neutre Neutre, se laver ne me semble pas essentiel mais il y a tout de même un sens figuré donc pas tout à fait le même sens que se + laver. Cdlt, VIGNERON * discut. 18 juin 2009 à 13:20 (UTC)
Contre Contre se laver est justement un bon exemple. Dans la langue qui m'intéresse le plus, laver et se laver sont traduits par deux verbes différents. De plus, les pages sont déjà assez surchargées comme ça, à mon avis, voir par exemple la page lever qui est complètement inutilisable en l'état. Beru7 21 juin 2009 à 23:18 (UTC)
Il y a plusieurs parties qui composent ma propositions, tu es contre quoi précisément ? Mglovesfun 21 juin 2009 à 23:30 (UTC)
Pardon ! contre la première partie. A la réflexion, Contre Contre pour les autres langues aussi. Chaque langue mériterait une politique différente à ce sujet, à mon avis. Beru7 21 juin 2009 à 23:39 (UTC)
Contre Contre Je serai également pour faire des articles séparés dès que l'on en a l'occasion. Plusieurs remarques sur les verbes pronominaux: Les articles produire et se produire n'ont aucun lien l'un vers l'autre! Comment mettre ces liens ? Un bandeau "voir"; mettre l'article racine dans "Etymologie" et le pronominal dans "Composés" ? Il y a également un verbe surprenant se vacher qui n'a qu'une définition pronominale, le verbe vacher ne semble pas avoir de définition. Il s'agit de prendre ce cas en compte dans la logique des liens. Jona 23 juin 2009 à 09:33 (UTC)
Dans des cas comme se vacher, je pense qu'il est bon de créer la page, mais aussi de mentionner en plus le verbe dans la page vacher, soit en donnant une définition de se vacher (plus un lien vers se vacher, par exemple entre parenthèses à la fin de la définition), ce qui permet d'avoir un minimum d'information directement, soit uniquement le lien (par exemple en utilisant le modèle cf). C'est important, car la plupart des gens chercheront ce verbe à vacher. Pour les verbes comme laver, se laver pourrait être cité dans les Dérivés (-drv-), effectivement (à noter que je propose la suppression du modèle -compos-, que chacun interprète à sa façon, et qui n'est pas du tout clair pour les gens). Dans le sens inverse (se produire vers produire), le lien pourrait être présent via la section étymologie. (dans tous les cas, le bandeau voir en début de page n'est pas du tout fait pour ça). Lmaltier 23 juin 2009 à 10:01 (UTC)
Et s’amuïr (selon {{R:ODS5}}) n'existe qu'à la forme pronominale). Mglovesfun (disc.) 1 juillet 2009 à 10:56 (UTC)
Pour clarifier ce que je pense : on devrait systématiquement créer la page pour le verbe simple (même pour amuïr), pour faciliter les recherches, et autoriser aussi la page avec le pronom à chaque fois qu'on peut appeler ça un verbe pronominal (après tout, le "se" fait partie du nom du verbe pronominal, et on est donc susceptible de rechercher se laver). Par contre, il ne semble pas utile de créer les formes conjuguées comprenant le pronom, qui sont très peu susceptibles d'être recherchées. Lmaltier 1 juillet 2009 à 11:48 (UTC)
Bonjour. Le problème des verbes pronominaux, c'est qu'ils ne sautent pas toujours aux yeux du lecteur peu familiarisé avec le français: Se laver apparait surtout en "me lave" , "te lave", "nous lavons", sans compter les "nous nous sommes, à l'eau tiède, avec du savon mou, sous la douche, de l'appartement etc., "lavé"," et là ça devient plus complexe, si j'en crois mon état d'incompréhension devant une phrase allemande du même genre. Il me parait dons important d'assuer la liaison entre le verbe simple et la forme pronominale. Sous la forme que l'on veut. François GOGLINS 1 juillet 2009 à 12:12 (UTC).

Consensus[modifier le wikicode]

Ajout du 1er juillet 2009[modifier le wikicode]

En m'inspirant du Wiktionary j'ai ajouté :

1.4 En cas de doute ou de contestation sur l’existence d’un mot dans une langue, un moyen de preuve peut être la présence du mot dans une terminologie officielle. Sinon, il faut vérifier que le mot est bien attesté. Sur le Wiktionnaire, cela veut dire trois attestations fiables (pas uniquement des fautes de frappe) écartées d’au moins un an.

On peut facilement retirer cette mention, si vous le pensez nécessaire. Mglovesfun (disc.) 1 juillet 2009 à 10:43 (UTC)

Je ne suis pas d'accord du tout sur la période d'un an. Un mot peut très bien devenir très utilisé très rapidement, beaucoup plus vite que ça. Ce genre de restriction peut se comprendre sur un dictionnaire papier (pour diverses raisons : temps nécessaire pour la publication et place limitée, qu'on ne veut pas gaspiller en mettant un mot qui risque de ne plus être utilisé au moment de la publication). Ces raisons ne s'appliquent pas à un wiki. Au contraire, un mot récent a des chances d'être très consulté, par ceux qui veulent savoir ce que ça veut dire.
Je ne suis pas non plus d'accord avec un nombre d'attestations trop figé. L'important, c'est d'être certain que le mot existe, que ce n'est pas une fantaisie individuelle. Le Wiktionary refuse des mots qu'il sait pourtant exister à cause de ses critères trop figés, ce n'est absolument pas normal, c'est contraire au principe tous les mots de toutes les langues.
En attendant des réactions supplémentaires, je remets donc comme c'était avant. Lmaltier 1 juillet 2009 à 11:35 (UTC)
D'accord avec Lmaltier, mêmes arguments. Markadet∇∆∇∆ 1 juillet 2009 à 11:47 (UTC)
Comme dit Lmaltier, l'avantage du dictionnaire wiki est d'être très réactif. C'est une de ses forces et il faut la conserver. Un mot nouveau, créé rapidement sur Wiktionnaire fait de la publicité pour Wiktionnaire, qui est le seul à l'expliquer. Il est intéressant de faire la chasse à ces mots nouveaux pour les ajouter rapidement pour les internautes en recherche.--Béotien lambda 1 juillet 2009 à 11:51 (UTC)

Ajouts à proposer (pas finis)[modifier le wikicode]

Je propose, ou proposerai quand je l'aurai fini, d'insérer les sections suivantes, avec l'accord des autres contributeurs. Mglovesfun (disc.) 12 août 2009 à 16:16 (UTC)

Langues reconstruites[modifier le wikicode]

Une langue reconstruite n’est pas une langue, mais une langue théorique formée en tenant compte des similarités entre certaines langues. Le latin canis (qui a donné chien en français) serait du proto- indoeuropéen *ḱwō. Néanmoins, le mot n’est pas attesté n'a probablement jamais existé. Pour cette raison, les langues reconstruites ne sont pas acceptées sur le Wiktionnaire.

Il est de même pour les mots reconstruits dans les langues réelles. Le français dent est du latin classique dens, donc en suivant les règles de morphologie il serait devenu dente en latin populaire. Néanmoins, comme pour tous les autres mots Wiktionnaire, sans attestation il n’est pas valable.

Je suis d'accord. Néanmoins, il faudrait peut-être faire ça en même temps que la politique générale sur les langues acceptées, car ce sont des explications complémentaires (cf. le vote en cours sur la Wikidémie). Lmaltier 12 août 2009 à 16:40 (UTC)

Toponymes[modifier le wikicode]

Les noms de lieux (également appelés des toponymes) sont acceptéz sur le Wiktionnaire, notamment pour inclure l’étymologie et les dérivés (Paris donne les gentilés parisien et Parisien, par exemple). Si est utilisé dans plusieurs langues, on peut créer une section pour chaque langue (→ voir London et Londres pour un exemple).

Je suis d'accord. Je changerais simplement Les noms de lieux (également appelés des toponymes) en Les toponymes (en effet, on peut à la rigueur dire que la cabane au fond du jardin est un nom de lieu, mais ce n'est pas un toponyme). Je changerais aussi sont actuellement accepté en sont acceptés, et Si le mot existe en plusieurs langues en Si le mot est utilisé dans plusieurs langues (pour clarifier, car la notion d'existence d'un mot dans une langue est souvent mal comprise). Lmaltier 12 août 2009 à 16:40 (UTC)
N’hésite pas à modifier, je crois que j'ai écrit ce que je voulais écrire. Mglovesfun (disc.) 12 août 2009 à 16:43 (UTC)

Nombres[modifier le wikicode]

Il faut dire que certains chiffres nombres sont acceptés, par exemple 69 (position sexuelle) et 360 (voir l'anglais). Mglovesfun (disc.) 12 août 2009 à 22:26 (UTC)

J'ai remplacé chiffre par nombre, pour éviter la confusion. Un chiffre, au sens premier, est d'abord un symbole pour écrire les nombres. Ils sont donc en nombre limité, et méritent chacun un article : 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 (pour nos chiffres arabes). Le problème de l'acceptation d'article s'applique donc plus précisément aux nombres, qu'ils soient écrits en chiffre ou pas.
Les nombres représentent une série infinie (1, 2, 3, 10, 10^3, 3,14 etc.). Néanmoins, certains nombres (écrits en chiffres) ont un côté linguistique, par exemple 06 est un nom commun en français, et 360 est un nom commun en anglais. — Dakdada (discuter) 13 août 2009 à 16:35 (UTC)
Ceux de Catégorie:Bandeaux de numéraux ont été ajoutés pour pouvoir naviguer plus vite vers leurs traductions. JackPotte 29 août 2009 à 08:12 (UTC)

Noms[modifier le wikicode]

Les noms de famille et les prénoms sont acceptés sur le Wiktionnaire. Néanmoins, seul leur côté linguistique est admis - une brève définition suffit et on ne cite pas les individus ayant ce nom (par exemple, on ne met pas Bill Clinton et Hillary Clinton dans l’article Clinton). Ces informations sont réservées à Wikipédia. (disc.) 12 août 2009 à 22:26 (UTC)

Erreurs d’orthographe[modifier le wikicode]

Le modèle {{-erreur-}} sert à classer une entrée en tant qu’erreur d’orthographe. Il est difficile de savoir comment définir une erreur « courante ». En principe, il faut que le mot soit « attesté », par exemple sur un moteur de recherche fiable. (disc.) 12 août 2009 à 22:26 (UTC)

Anglais[modifier le wikicode]

Pour Pour rediriger to be vers be#Anglais. JackPotte 30 août 2009 à 01:40 (UTC)

Ratio pour les variantes[modifier le wikicode]

On peut lire ici : « Les variantes orthographiques d’un même mot peuvent être toutes présentes, sauf quand il s’agit clairement de fautes d’orthographe (sauf erreurs répandues, voir ci-dessous). ». Plus loin on lit : « Il est difficile de savoir comment définir une erreur « courante ». . D'un côté, on tolère tout, et de l'autre (pour les "fautes") on parle de fréquence. Mais une faute n'est parfois pas une variante rare (exemple locace pour loquace). Et une variante rare, n'est parfois pas une faute. Je pense qu'il faut tenir compte du ratio entre le nombre d'attestations de la variante et celui du mot principal. Par exemple, si le mot est attesté 200 fois, on peut considérer qu'une variante existe si on trouve au moins quelques attestations de cette variante. Pour 20 000 attestations ce serait au moins 200 attestations de la variante. 200 000 attestations/2000 attestations, etc. Ce ratio doit seulement être un guide, 1%, 5%, 0,5% selon les cas. Selon le nombre de variantes, selon leur répartition, selon la qualité des attestations, selon le nombre total d'attestations. C'est très subjectif. Mais on ne peut pas dire « Les variantes orthographiques d’un même mot peuvent être toutes présentes ». Autant une seule attestation d'un mot peut suffire, mais pas une seule attestation d'une variante (sauf si le mot est lui-même très rare). Stephane8888 discut. 8 mars 2010 à 13:49 (UTC)

Il faudrait étudier l'existant aussi Catégorie:Fautes_d’orthographe_en_français. JackPotte ($) 8 mars 2010 à 14:16 (UTC)

J'imagine que la première phrase citée signifie variantes orthographiques soit répertoriées dans les dictionnaires, soit d'un usage en gros aussi courant les unes que les autres, en tout cas du même ordre de grandeur. Cela ne veut évidemment pas dire toutes les fautes d'orthographe. Mais on n'est jamais assez clair, il faudrait donc clarifier. Lmaltier 13 octobre 2010 à 16:54 (UTC)

Sérieux des sources (au sens d'« attestations »)[modifier le wikicode]

Lors des importantes modifications faites par Béotien lambda, le qualificatif de « sérieux » a été introduit pour qualifier une source : « que ces termes peuvent être attestés avec des sources sérieuses (limite basse) ». Je précise que le mot source désigne ici une source qui atteste le mot., et non une référence lexicographique qui aurait déjà décrit le mot. Je pose donc la question : Quels sont les critères objectifs qui définissent le sérieux d'une source ?
Selon moi, il faut seulement vérifier si l'attestation est un emploi réel du mot. Si ce n'est pas seulement une tentative d'introduction d'un nouveau mot. Si ce n'est pas uniquement une construction métalinguistique. Je pense que le mot sérieux est à remplacer par authentique.
En dehors de ces quelques cas, selon moi, une source est une source, nous ne devons pas la juger, mais simplement l'analyser. Et donner au lecteur nos conclusions. Analyser c'est le rôle du lexicographe. Il se limite à ces quelques petites démarches :

  • reconnaître dans quelle langue le texte est écrit.
  • reconnaître le rôle grammatical du mot dans l'attestation, son genre, son nombre.
  • signaler la rareté d'une graphie. Signaler éventuellement les points de vue des autorités linguistiques au sujet de cette graphie. L'ignorer s'il n'y a rien à dire à son sujet (coquille ou faute peu fréquente, c'est-à-dire variante ultra minoritaire d'une autre graphie).
  • tenter de cerner la vieillesse, le registre d'un mot. Ces indications sont précieuses même si elles resteront toujours approximatives. Des attestations sont à cette fin précieuses.

Débattre de la sériosité d'une source, d'un site internet, d'un journal, d'un éditeur, d'un auteur, d'un texte, sur un projet comme le notre me semble voué à l'échec : Est-ce que proctologie.com est sérieux ? Est-ce que Rabelais était sérieux ? On s'en moque, ce qui compte c'est de donner au lecteur les informations relatives aux mots qui ont été publiés et authentiquement utilisés. À nous de répondre au lecteur quand il se demande : « Que veut dire ce mot ? Puis-je l’utiliser ? Si oui dans quel contexte ? » Stephane8888 13 octobre 2010 à 13:07 (UTC) P.S. : Béotien lambda avait, me semble-t-il, témoigné son attachement au point de vue que je défends ici aujourd'hui et que je défendais en juillet dernier. Notez : « locutions authentiquement attestés. » et « […] Internet. Je ne m’autorise pas à restreindre la taille de ce corpus. ». Concernant Béo, je peux me tromper, le mieux serait qu'il nous revienne.

Est-ce qu'il ne pensait pas en fait à des dictionnaires ou autres ouvrages de référence en parlant de sources sérieuses (limite basse) ? Il me semble effectivement qu'un mot qu'on n'arrive pas à trouver attesté nous-mêmes, mais qui est décrit par un dictionnaire dont on connait le sérieux et qui n'irait de toute évidence pas inclure des mots inventés par eux, peuvent être inclus. Et c'est une limite basse dans le sens qu'on n'exigera pas d'attestations dans ce cas. De toutes façons, ça exige d'être clarifié,on n'est jamais assez clair. Lmaltier 13 octobre 2010 à 16:45 (UTC)
A part ça, je suis bien sûr d'accord sur le fait que Rabelais n'est pas plus sérieux qu'un forum, l'important c'est de bien analyser la situation pour écarter les mots qui pourraient n'être que des coquilles ou des confusions involontaires de la part de celui qui écrit (ce n'est pas toujours facile, mais ça se fait en général bien). Lmaltier 13 octobre 2010 à 16:49 (UTC)
Concernant Béo, je ne pense pas qu'il parlait de dictionnaires.
Je suis d'accord qu'un dictionnaire sérieux (pas Médiadico jusqu'à preuve du contraire) équivaut à une attestation. J'ajoute que la présence d'un mot dans un ouvrage du type Enrichissement de la langue francaise: Dictionnaire de mots nouveaux, de Jean Baptiste de Radonvilliers Richard, ne compte pas pour une attestation. De façon générale, c'est le contenu pertinent, donc lexicographique, qui prime. Le Grand Dictionnaire terminologique traite de aréoport. Cela n'équivaut pas à une reconnaissance, mais seulement à une information linguistique. Stephane8888 13 octobre 2010 à 20:39 (UTC)

Quand dans le même temps Larousse dit « chélicère est masculin » et que le Grand Robert affirme « chélicère est féminin », aucun des deux sur ce point, malgré qu'ils se définissent comme des dictionnaires descriptifs, ne décrit la langue ! Comme ils ont œuvré de façon certaine, j'imagine pour leur défense qu'ils n'utilisent pas le même corpus. Une chose cependant n'a pas pu leur échapper : les deux genres sont en concurrence…

Quand, toujours récemment, l'Académie française décrit le mot chélicère sans en préciser le genre, alors que la seule chose qu'on attende de cette autorité normative c'est qu'elle tranche, on est encore une fois floués ! On imagine qu'ils avaient des arguments pour chacun des deux genres… mais lesquels ? La contradiction Larousse-Robert ? ^^

Cela prouve bien, dans l'optique du Wiktionnaire, que c'est la description qui importe, pas la conclusion érigée en dogme. Plutôt que de dire : « L'attestation n'est pas sérieuse. », mieux vaut dire « L’attestation est authentique, décrivons la, et informons le lecteur. ». Stephane8888 13 octobre 2010 à 21:20 (UTC)

Renommage[modifier le wikicode]

Proposition au sujet des fautes d'orthographe[modifier le wikicode]

Suite au feuilleton samsarâ, je propose de rajouter au paragraphe "fautes d'orthographe" un laïus du genre :

  • Quand il est difficile de trancher entre une simple faute d'orthographe et une variante orthographique (par commodité, dans la suite, j'appellerai orthographe 1 l'orthographe qui n'est pas contestée, l'orthographe 2 celle qui pose question), il est recommandé de chercher des attestations dans des textes (livres, etc.) où le terme (avec l'une ou l'autre orthographe) a plusieurs occurrences ; parmi ceux-ci , on pourra comparer :
    • les textes A qui ne contiennent que des occurrences avec l'orthographe 1.
    • les textes B qui ne contiennent que des occurrences avec l'orthographe 2.
    • les textes C qui contiennent des occurrences avec l'orthographe 1 et 2. Ces derniers démontrent une certaine hésitation ou indifférence vis à vis de la question de la part de l'auteur (ou de l'éditeur, ou du relecteur,...) et ne sauraient trop servir à justifier que l'orthographe 2 est une variante.

Par contre, la quantité (en absolue et relativement à A) des textes B, ainsi que leur notoriété (point peut-être polémique, on peut l'enlever...), etc... joueront en faveur de la thèse de la variante.

Discussion[modifier le wikicode]

Cette façon de faire me parait plus rigoureuse que la "méthode google" : par exemple, si on trouve 10 livres avec 10 occurrences: à chaque fois, 9 occurrences avec l'orthographe 1 et 1 avec l'orthographe 2:

  • la méthode "google" donnera un ratio de 1/10, ce que certains trouvent suffisants pour envisager la cas d'une variante.
  • La méthode ci-dessus trouvera 0 texte B : faute d'orthographe.

à l'inverse, si on trouve 10 livres : 9 livres avec 10 occurrences d'orthographe 1, et 1 livre avec 10 occurrences d'orthographe 2 :

  • la méthode "google" donnera à nouveau un ratio de 1/10.
  • La méthode ci-dessus trouvera 1 texte B : elle envisagera donc la possibilité de la variante plus sérieusement que dans le cas précédent, ce qui me semble judicieux.

Dites-moi ce que vous en pensez...Hector (discussion) 16 mars 2018 à 23:41 (UTC)

  • Cela fait plaisir de voir le sujet abordé sereinement et sainement. Je rappelle juste que, quand on met variante orthographique, ce n’est en aucune façon une approbation, ça ne dit pas que cette variante est à conseiller ou à accepter, ni que c’est une possibilité à considérer sérieusement quand on hésite, cela dit simplement ce que ça dit : l’orthographe utilisée en pratique est variable, et cette orthographe est utilisée en pratique de façon non négligeable. Mais bien sûr, on ne tient pas compte des coquilles manifestes (par exemple chevzl au lieu de cheval). Si une orthographe est en réalité une coquille selon l’auteur, il ne faut donc clairement pas en tenir compte. Mais je dirais que la variété d’orthographes à l’intérieur de mêmes livres peut justement être un argument pour la variabilité de l’orthographe du mot de façon générale, et donc plutôt un argument pour dire qu’il y a des variantes (or cas de coquilles désavouées par l’auteur, bien sûr). En tout cas, cette autre façon de voit se tient aussi, il me semble. La remarque Ces derniers démontrent une certaine hésitation ou indifférence vis à vis de la question est tout à fait vraie, et va plutôt dans ce sens. Lmaltier (discussion) 17 mars 2018 à 07:22 (UTC)
  • La méthode gogol est assez approximative lorsqu'il s'agit de signes diacritiques ; il faut souvent vérifier qu'il ne s'agit pas d'une approximation d'OCR en allant lire la photo du texte d'origine (quand c'est une photo) ou le papier, si l'on peut y accéder. Pour le reste, je partage la vision de Lmaltier : Nous n'avons pas à trancher une norme sur des usages courants ; mais nous pouvons y ajouter le registre de langue (il y a des mots à ne pas mettre dans une lettre de motivation lorsque l'on sollicite un emploi).
    Il y a plusieurs mois lorsque j'ai traité 2 livres de Frédéric Weisgerber pour du vocabulaire français du Maroc, dans les 2 ouvrages, l'un de 1907, l'autre de 1946, la graphie était assez souvent différente. Du même auteur qui introduisit le mot dans le vocabulaire français. Quelle est la bonne ? Certainement celle qui existe encore aujourd'hui, mais le ou les autres graphies --sont-elles mauvaises ? A mon avis, lorsque c'est un peu complexe, il serait bon d'un ajouter des commentaires en note. --François GOGLINS (discussion) 17 mars 2018 à 17:44 (UTC)
Je me pose la question de savoir s’il y a des textes lexicographiques sur ce point ? Personnellement, je n'ai pas encore lu de considérations dans mes lectures sur l’orthographe du français à ce point en particulier. --— Lyokoï (Discutons Mort de rire) 17 mars 2018 à 18:02 (UTC)
Pour ce qui est des termes d'origine sanskrite, oui, bien sûr, il existe des quantités de lexiques, aucun que je connaisse qui écrive le mot de manière erronée et pourquoi le feraient-ils?--Zhuangzi (discussion) 17 mars 2018 à 19:24 (UTC)
Vous pouvez cesser de tout rapporter au sanskrit ? Cette réflexion s’applique à toutes les langues. --— Lyokoï (Discutons Mort de rire) 19 mars 2018 à 18:01 (UTC)
Je ne parle que de ce que je connais, pour ce qui est des mots d’origine arabe, par ex. je n’en sais rien, mais je sais que je n’ajouterais pas une page sans me renseigner, sans savoir s’il s’agit d’une coquille ou pas, simplement parce que j’aurais vu le mot quelque part.--Zhuangzi (discussion) 20 mars 2018 à 08:52 (UTC)
  • Les diacritiques sont extrêmement volatile. Quelque soit le terme d’origine sanscrit en contenant, on trouvera ce type de ratio quelle que soit la langue, anglais, allemand, etc. C’est pour cela que cette règle a été instaurée pour les diacritiques. Dans le wiktionary anglais comme dans les autres les mots d’origine sanskrite sont soit écrit sans diacritique, soit avec la transcription officielle, l’IAST. AUCUN wiktionary de quelle langue que ce soit n’est assez abruti pour inclure « samsarâ ». Si on ne trouve aucun auteur qui n’utiliserait que la graphie erronée et justifierait celle-ci, alors le fait qu’il s’agisse d’une simple coquille est évident, c’est du simple bon sens. On pourra élaborer toutes les règles que l’on veut, si certains sont dénués de bon sens et de bonne foi et se mettent au-dessus de ces règles, ça ne sert à rien.--Zhuangzi (discussion) 17 mars 2018 à 19:24 (UTC)
  • Hélas, Lmaltier trouvait « plaisir de voir le sujet abordé sereinement et sainement. » En vain. Je n'espère rien ; je suis patient. --François GOGLINS (discussion) 17 mars 2018 à 19:46 (UTC).
Merci pour vos réponses.
    • Ma phrase sur l'indifférence et l'hésitation est effectivement ambiguë. Pour mieux préciser la démarche, je précise que je pars du postulat qu'un auteur ou un éditeur ne veut pas - sauf raisons particulières - laisser volontairement 2 orthographes du même mot dans un livre : par cohérence, il en choisit une et s'y tient (on peut demander à Delarouvraie ce qu'elle en pense , elle qui travaille dans l'édition, de ce postulat). Si on trouve des livres avec 2 orthographes, c'est donc involontaire. La raison de ce raté nous est inconnue, elle peut signifier une coquille du relecteur, elle peut révéler une hésitation de l'auteur, etc..., mais de fait, il y a un raté qu'on ne peut interpréter, d'où l'idée d'écarter ces livres. Si c'est une variante, utilisée consciemment par l'auteur et l'éditeur, on doit pouvoir trouver des livres sans incohérence éditoriale ! c'est le cas des 2 exemples que j'ai glanés dans les parages, nénuphar et içi. Hector (discussion) 19 mars 2018 à 08:06 (UTC)
    • Je précise qu'en général, pour attester un mot (par exemple nidifiаbilité), le fait que les attestations trouvées appartiennent ou pas au même livre, n'a que peu d'importance. Ici on est dans un cas particulier où on cherche à attester une variante orthographique : si le postulat plus haut sur la cohérence éditoriale sur l'orthographe est valable, alors autant s'en servir pour améliorer notre critère de sélection.
    • Le cas de Weisberger est intéressant car c'est lui qui crée le mot (par curiosité, te souviens-tu de certains de ces mots), mais il me semble que ça ne change pas le fond du problème. Hector (discussion) 19 mars 2018 à 09:45 (UTC)
Je confirme qu'on ne laisse pas volontairement deux orthographes dans un même ouvrage contemporain. Il est possible mais non souhaitable que cela arrive dans des ouvrages collectifs où des co-auteurs sont restés chacun sur leur position. Pour les ouvrages anciens (genre ancien à moyen français) on laisse les graphies différentes car l'ortho-graphe n'existait pas. Pour le cas particulier de notre feuilleton, j'ai vite décroché parce que les dialogues étaient mauvais. Delarouvraie 🌿 19 mars 2018 à 10:07 (UTC)
Merci à Hector d’avoir expliqué son postulat (que je n’avais pas compris). Mais je pense que c’est sans doute quelque chose que les éditeurs ou auteurs considèrent généralement comme souhaitable, sans plus. Par exemple, ils peuvent choisir de suivre un dictionnaire de référence (car ils ne vont pas réfléchir à l’orthographe de chaque mot du livre…). Mais j’imagine que la plupart ne choisissent pas parce qu’ils n’ont même pas conscience d’utiliser plusieurs orthographes différentes, surtout pour les mots rares absents des dictionnaires courants. Ils ne réfléchissent à ça, je suppose, que si quelqu’un soulève le problème. Lmaltier (discussion) 19 mars 2018 à 19:59 (UTC)

Je trouve la proposition d’Hector très intéressante, mais la formulation un peu trop logique (je ne sais pas comment l’exprimer mieux, ça me fait penser à un raisonnement de logique avec les lettres et chiffres), et il me semble qu’il serait bon de travailler un peu la forme pour qu’elle soit plus claire. Est-ce que vous pensez que nous pourrions avancer sur ce point ici ou qu’il serait préférable de lancer une prise de décision sur ce point ? Sourire Noé 2 mai 2018 à 12:29 (UTC)

pas de problème pour moi le mieux est sans doute d'avancer ici.Hector (discussion) 8 mai 2018 à 08:26 (UTC)

Hors-sujet sur samsarâ[modifier le wikicode]

Si le mot nidifiable existe (et c'est le cas), rien n'empêche de former le mot nidifiabilité, je veux bien croire que l'on trouve ce mot, mais je ne vois pas le rapport. Les exemples nénuphar et içi sont hors-sujet. Ils ont des origines historiques et comme le souligne Madame Delarouvraie, l'orthographe n'existait pas à cette époque. Madame Delarouvraie avait déjà été sollicitée et nénuphar également discuté. Je sais bien que la discussion était interminable, parce que Lmaltier et Gogglins se moquent éperdument des arguments rationnels apportés, c'est pourquoi je pète si facilement les plombs, autant parler à un mur et j'espère que vous n'allez pas me faire répéter tous les arguments mis dans la discussion. Il n'existe pas de particularité française pour l'orthographe du terme samsara.Le wiktionary anglais, comme le recommande aussi le wiki francophone, a tout simplement opté pour deux formes: une sans diacritiques et une autre où l'on met tous les diacritique, selon la transcription officielle dite IAST. Sinon, comme l'ont expliqué les anglophones à Lmaltier, il faudrait ajouter "sâmsara", "samsârâ", "sâmsarâ", ce serait une histoire de fou. Idem pour tous les autres mots sanskrits qui contiennent des diacritiques. Plus ils sont connus, plus on trouve d'erreurs et ne pas mentionner quelle est la bonne orthographe ou affirmer qu'il ne s'agirait là que d'une variante serait de la désinformation. PERSONNE n'utilise jamais seulement et à plusieurs reprises le mot écrit ainsi. De temps en temps, on trouve une coquille, même dans un Que sais-je, mais jamais personne n'a écrit volontairement écrit "samsarâ". Si vous êtes d'un autre avis, expliquez-moi pourquoi (je suis allé jusqu'à écrire à un auteur pour lui en demander confirmation, ce qu'il a fait, bien entendu). Depuis trente ans que je fais du sanskrit et que je lis des livres sur l'Inde, sa philosophie, etc., si c'était le cas, j'en aurais entendu parler. Gogglins l'a dit ouvertement, il s'en fout, il trouvé le mot écrit comme ça et cela lui suffit, ne serait-ce que pour faire chier ceux qui s'adonnent aux bondieuseries, c'est pourquoi il refusait même que l'on précise que le mot ne s'écrit pas comme ça en sanskrit.--Zhuangzi (discussion) 19 mars 2018 à 13:08 (UTC)
Évidemment que le mot ne s’écrit pas comme ça en sanskrit, puisque le sanskrit n’utilise pas l’alphabet latin, ça n’apporte rien de l’indiquer. Des coquilles peuvent se produire, mais pas dans une telle proportion, ça n’a pas de sens. Oui, on pourrait probablement ajouter d’autres orthographes avec les diacritiques placés différemment : du moment que le contenu de la page est correct, pourquoi pas ? C’est vrai qu’on n’en aura jamais fini, que le Wiktionnaire ne sera jamais complet, tout le monde le sait ici. Oui, c’est un projet de fou. Quant à dire que jamais personne n'a écrit volontairement écrit "samsarâ", c’est purement gratuit. Il faut absolument comprendre la logique du projet, qui ne vise pas à indiquer comment tel ou tel mot doit s’écrire, mais comment il s’écrit en pratique, et en essayant de donner le maximum de renseignements utiles à ce sujet pour que le lecteur puisse faire son choix de façon avisée, et c’est ce que nous essayons de faire dans ce cas. Tant que vous n’aurez pas compris ça, ce n’est pas la peine de continuer à essayer de convaincre. Lmaltier (discussion) 19 mars 2018 à 18:30 (UTC)
Vous confondez langue et écriture. Le sanskrit n’a pas d’écriture qui lui est propre et il s’écrit bel et bien aussi en alphabet latin. Ce n’est que pour vous que la proportion paraît importante, ce qui n’est pas le cas quand il y a des diacritiques. Et si on comparait la proportion de samsarâ avec celle de toutes les formes correctes, elle serait proche de zéro. Non, ce n’est pas gratuit du tout de dire que jamais personne n'a écrit volontairement écrit « samsarâ », c’est du simple bon sens. Si vous refusez de faire usage de votre bon sens, alors donnez au moins un exemple, ne serait-ce qu’un seul, de quelqu’un qui utiliserait de préférence cette orthographe.--Zhuangzi (discussion) 20 mars 2018 à 08:52 (UTC)
Si je n’arriverai pas à vous convaincre, c’est que vous n’avez rien à faire de la vérité et voulez seulement avoir raison. Vous n’avez pas arrêté de changer d’argumentation, en commençant par « il y en a trop, ça ne peut pas être une coquille », vous avez cherché une raison linguistique, ce qui est ridicule (comment deux lettres pourraient changer, pourquoi seulement en français, pourquoi seulement une fois sur dix dans l'oeuvre d'un auteur, etc.) Vous ne trouvez bien évidemment aucune raison. Vous vous contentez donc de ne pas répondre à celles-ci. Si ce n’est pas une coquille, alors c’est quoi ? Vous demeurez dans l'incapacité de proposer ne serait-ce qu’une hypothèse.--Zhuangzi (discussion) 20 mars 2018 à 12:14 (UTC)

Réflexions (pas très digeste...) sur le sens de faute d'orthographe dans un dictionnaire descriptif[modifier le wikicode]

Justification[modifier le wikicode]

Est-ce que ça a un sens de parler de fautes d'orthographe dans un dictionnaire qui se veut descriptif ? Une réponse possible, c'est que si nous, wiktionnaire, ne pouvons pas décider si une graphie est bonne ou pas de notre point de vue (ce serait normatif), l'auteur du texte dans lequel se trouve la faute, si! Il faut donc chercher à percevoir l'état d'esprit de l'auteur vis à vis de cette graphie.

J'ai essayé ici de structurer des idées souvent émises par d'autres dans différents fils de discussion.

Classification[modifier le wikicode]

On peut distinguer de ce point de vue 4 types de graphie alternative:

  1. La faute d'étourderie, ou coquille ; si l'auteur s'était mieux relu, il se serait corrigé.
  2.  La faute par facilité : on omet sciemment un accent, une cédille, pour aller plus vite...
  3. La faute par ignorance : si on fait remarquer à l'auteur qu'il existe une habitude consacrée d'écrire ce mot autrement, il n'a rien à redire (si ce n'est un oups) et change sa graphie (on le suppose de bonne foi, et que, vexé, il ne campe pas sur sa position...).
  4. La variante : même si quelqu'un fait remarquer à l'auteur qu'il existe une habitude consacrée d'écrire ce mot autrement, il se tient néanmoins à la façon dont il l'a écrit, pour telle ou telle raison (d'autres auteurs de référence l'utilisent comme ça, une norme dit qu'il faut l'écrire comme ça, l'usage de cette variante est établi, cette variante colle mieux à l'étymologie, etc.).

Biotope de ces graphies[modifier le wikicode]

  1.  Les coquilles sont plus rares (mais néanmoins on en trouve) dans les livres édités (où il y des relectures). Sinon elles sont très minoritaires par rapport à l'orthographe habituelle.
  2.  Les fautes par facilité n'existent que pour certains caractères difficiles à taper pour des raisons techniques (accents et cédilles difficilement trouvables et laborieux à taper sur certains claviers, etc.). Si on ne les trouve plus dans les écrits formels (notamment les livrés édités), elles peuvent être très fréquentes ailleurs.
  3. Les fautes par ignorance concernent en général une graphie homophone (2 p versus 1 p, i au lieu de y, oubli d'un h, etc.). Elles peuvent se trouver aussi bien sur l'entièreté d'un texte (l'auteur est persuadé que cette écriture est la bonne), que sur une partie seulement (l'auteur ou les relecteurs inconsciemment hésitent, ou le relecteur n'a pas repéré et donc corrigé toutes les occurrences de la faute commise par l'auteur, etc.). Néanmoins dans les livres édités où il y a des relecteurs, elles sont plus rares. Un spécialiste du sujet qui concerne le mot considéré a une chance quasi nulle d'en faire (mais ses relecteurs, éditeurs, si...)
  4.  Les variantes, comme elles sont assumées, devraient se retrouver tout au long d'un texte (même si des relecteurs peuvent toujours "corriger" contre la volonté de l'auteur une partie des occurrences).

Taxinomie[modifier le wikicode]

La connaissance du biotope de ces types de graphies permet de faciliter le classement de ces graphies ; en cas de doute, on peut recourir à des méthodes plus quantitatives ou directes pour vérifier une intuition :

  • La méthode google (ratio graphie considérée/ensemble des graphies faible) est efficace pour repérer les coquilles.
  • Trouver des livres avec plusieurs occurrences du mot utilisant toutes la même graphie (méthode dite intégrale décrite plus haut) permet de justifier un catalogage en variante (et ce d'autant plus facilement que la maison d'édition est reconnue, ou que l'auteur est un spécialiste du domaine si le mot est technique).
  • Sinon , la méthode la plus efficace, mais pas toujours possible : demander directement aux auteurs (c'est ce qu'a fait Zhuangzi pour samsarâ, chapeau à lui pour ça).

Bien sûr, il restera des cas limites difficiles à trancher...Dans ce cas, respirer un coup, relativiser (le WT ne va pas mourir pour un cas limite en trop ou manquant), reste courtois et respecter les choix inévitables est le mieux à faire...

Exemple (non tranché)[modifier le wikicode]
  • On trouve trop d'attestations de Samsarâ pour que ce puisse être considéré comme simple coquille.
  • Samsarâ n'est pas une faute par facilité , vu qu'il a lui aussi un accent circonflexe comme samsâra ! (la question se poserait pour samsara).
  • Samsarâ est-elle une faute par ignorance ou une variante ? D'un côté on trouve des livres même de spécialistes qui contiennent cette orthographe, et c'est troublant... Mais d'un autre côté (et c'est troublant aussi) aucun livre n'utilise uniquement cette orthographe (sauf si j'ai raté un train...), et donc rien ne prouve qu'il s'agit d'une variante ; bref , sans surprise, c'est un cas difficile à trancher...

Réglementation[modifier le wikicode]

Si la classification plus haut convenait, 2 points resteraient à trancher pour le wiktionnaire :

  • Que souhaite-t-on garder comme graphies ? Je dirais les variantes (4), mais y a-t-il consensus ?
  • Dans le doute, à qui revient le dernier mot ? Aux inclusionnistes (dans le doute, gardons) ou aux exclusionnistes (tout mot doit pouvoir justifier de sa présence) ?

Hector (discussion) 28 avril 2019 à 01:04 (UTC)

Tout ça me semble très bien réfléchi. Un exemple simple : l’orthographe de digeste dans le titre relève clairement du premier cas. Dans la plupart des cas, je pense que c’est la même chose, que c’est facile de classer de cette façon, mais il y a aussi des cas où c’est très difficile, et dans ces cas, qui entraînent des désaccords, il faut garder sans condamner. Il faut garder aussi les fautes par facilité dans les cas où la plupart des emplois emploient cette orthographe (en expliquant, bien sûr) : c’est souvent le cas pour des noms de localités ou de gentilés qui commencent par une lettre majuscule accentuée. Lmaltier (discussion) 28 avril 2019 à 09:26 (UTC)
Bonjour Hector, votre synthèse est intéressante, mais j'apporterai les précisions suivantes pour plus d'exactitude :
- La proportion d’occurrence de samsarâ est très faible : [1]
- Quand le mot apparaît sous cette forme c'est en effet soit une coquille soit une faute d'ignorance, mais cela peut être aussi par négligence ou inattention.
- Enfin et surtout, pourquoi n'est-ce pas une variante ? Parce qu'il y a une raison logique de prononciation de ce terme transcrit qui fait que si on met un accent, il faut le mettre sur le A long. Ainsi, il est très courant et accepté d'écrire samsara, mais il n'est pas concevable d'écrire sciemment samsarâ car la prononciation est samsAra (samsaara), voyez cette source [2]. --Asterix757 (discussion) 28 avril 2019 à 09:50 (UTC)
Le sujet n’est pas là (mais chaque orthographe peut avoir sa propre logique, il y a des cas classiques). Lmaltier (discussion) 28 avril 2019 à 11:12 (UTC)