Wiktionnaire:Prise de décision/Traitement lexicographique

Définition, traduction, prononciation, anagramme et synonyme sur le dictionnaire libre Wiktionnaire.

Le développement public de cette prise de décision a été abandonné au profit d'un projet plus vaste et personnel. Cette page restera donc une esquisse expérimentale. Pour de plus amples informations sur l'état actuel du projet, veuillez me contacter par message privé.

Avant-propos[modifier le wikicode]

Prolégomènes[modifier le wikicode]

La mise en place d'un tel dictionnaire nécessite un appareil linguistique puissant. Cet appareil est nécessaire pour la mise en place du traitement lexicographique, mais n'a pas besoin d'être maitrisé par les contributeurs.

La linguistique est une discipline qui ne présente aucune cohérence épistémologique. Nous avons donc choisi de refonder la terminologie.

Problématique[modifier le wikicode]

Comment réguler le dictionnaire ? Comment concilier expertise et pédagogie ?

Les principes fondateurs[modifier le wikicode]

La terminologie[modifier le wikicode]

Présentation[modifier le wikicode]

La terminologie est l'étude des termes utilisés dans une discipline.
Par extension, la terminologie est le résultat de cette étude : c'est l'ensemble des termes d'une discipline.

Le terminologie est épistémologiquement essentielle à l'étude : c'est l'outil — le langage — qui permet de décrire son objet. La linguistique est ainsi une discipline toute particulière, puisque son objet d'étude est également son outil. On parlera alors de métalangage, c'est-à-dire une langue — la métalangue, ici la terminologie linguistique — qui décrit le langage. Par cette particularité dont le linguiste ne peut se défaire, la terminologie linguistique doit davantage être pointue.

Problèmes[modifier le wikicode]

  • L'absence de terminologie entretient la confusion et l'incompréhension.
  • La terminologie en linguistique ne fait l'objet d'aucun consensus.

Discussions[modifier le wikicode]

Solutions[modifier le wikicode]

  • Refonder et clarifier la terminologie linguistique.
  • Créer une marque d'usage « Terme adopté par Wiktionnaire » : (Wiktionnaire).
  • Rassembler ces termes en un glossaire « Terminologie du Wiktionnaire ».

Les unités linguistiques[modifier le wikicode]

Le glosse[modifier le wikicode]

|glosse| = /phone/[sème]<>taxe<>.

Terminologie[modifier le wikicode]

De |γλῶσσα| = \glossa\[langue], et par apocope, de |glossème|.

Les termes suivants ont été rejetés :

  • Le monème porte à confusion avec le glossème |mono-| = [singulier].
  • Le morphème porte à confusion avec son morphe qui renvoie au signifiant et son sème qui renvoie au signe.
  • Le mot est polysémique.
  • Le nom est réservé au paradigme nominal.
  • Le rhème est réservé au prédicat informationnel.
  • Le signe est bipartite (signifiant et signifié), alors que le glosse est au moins tripartite (morphe, sème et taxe) ; nous le laisserons à la sémiologie.

Les méroglosses[modifier le wikicode]

Le morphe[modifier le wikicode]

Le phone[modifier le wikicode]
Le graphe[modifier le wikicode]

Le sème[modifier le wikicode]

Le taxe[modifier le wikicode]

L'endotaxe[modifier le wikicode]
L'exotaxe[modifier le wikicode]

Le glossème[modifier le wikicode]

Le glossome[modifier le wikicode]

Le glotte[modifier le wikicode]

Références[modifier le wikicode]

  • Sylvain Kahane, Les unités minimales de la syntaxe et de la sémantique : le cas du français, dans Congrès Mondial de Linguistique Française, no 219, p. 20 [résumé] [texte intégral] [texte intégral]

Les catégories linguistiques[modifier le wikicode]

Les catégories lexicales[modifier le wikicode]

Le nom[modifier le wikicode]

L'adjectif[modifier le wikicode]

Le verbe[modifier le wikicode]

Prolégomènes[modifier le wikicode]

Le verbe est très souvent prédicatif, c'est-à-dire qu'il est l'élément de la phrase qui ne porte aucune fonction syntaxique, et qui, par conséquent, régit tous les autres éléments de la phrase. Ainsi, on classe les verbes en fonction de ces subordonnés. On distinguera les aspects syntaxique et sémantique : la forme et le sens. Les rapports conceptuels entre les unités linguistiques sont les rôles sémantiques. Les procédés formels utilisés pour marquer ces rôles sémantiques sont les fonctions syntaxiques. On classe ainsi les verbes selon ces deux aspects : rôles sémantiques et fonctions syntaxiques.

Nous éviterons le terme complément dont la polysémie entache la clarté épistémologique.

Types de relations formelles :

  • Dépendance e (A <— B) : L'existence de A n'implique pas l'existence de B, et l'existence de B implique l'existence de A.
  • Interdépendance e (A <—> B) : L'existence de A implique l'existence de B, et l'existence de B implique l'existence de A.
  • Indépendance e (A — B) : L'existence de A n'implique pas l'existence de B, et l'existence de B n'implique pas l'existence de A.

Cette dépendance peut être formelle ou conceptuelle, autrement dit syntaxique ou sémantique.

Dans le cas de la dépendance, nous appellerons A le supérieur e de B, et B l'inférieur e de A.

Nous appellerons argument tout inférieur syntaxique. L'argument (Arg.) n'a pas de besoin sémantique, il peut être tautologique — Jouons à un jeu ! — voire dénué de sens — Il pleut. L'argument est une contrainte formelle relative à la langue.

Nous classerons donc les verbes en fonction de leur structure argumentale. En français, le modèle syntaxique maximal de la phrase verbale se présente ainsi : Arg.1 + Verbe + Arg.2 + Arg.3 + Arg.4.

  • Sujet (Suj.) : Nm
  • Objet (Obj.) : Nm
  • Adjet (Adj.) : Prép. + Nm
  • Attribut (Atb.) : Aj
  • Locatif (Loc.) : Prép. + Nm

La présence ou non du complément circonstanciel n'altère pas le rapport entre le verbe et ses arguments. Alors que la suppression ou l'insertion d'un complément sélectionné, hors emploi elliptique, modifie le sens du verbe.

Présentation[modifier le wikicode]

Problèmes[modifier le wikicode]

  • Les verbes sont classés par leur emploi canonique.
  • Les verbes attributifs ne sont pas reconnus.
  • Les verbes pronominaux sont dégroupés.

Solutions[modifier le wikicode]

  • Traitement des verbes en fonction de la valence de chacun de leurs emplois :
  • Intransitif — le verbe régit un seul argument : un sujet.
  • Paul dort.
  • Transitif — le verbe régit plusieurs arguments : un sujet et au moins un complément.
  • Transitif direct — le verbe régit deux arguments : un sujet et un complément direct e.
  • Paul mange une pomme.
  • Transitif indirect — le verbe régit deux arguments : un sujet et un complément indirect e.
  • Paul parle à Marie.
  • Bitransitif — le verbe régit trois arguments : un sujet et deux compléments.
  • Paul parle de football à Marie.
  • Tritransitif — le verbe régit quatre arguments : un sujet et trois compléments.
  • Paul a échangé son vélo contre une montre avec Marie.
  • Attributif — le verbe régit au moins un attribut.
  • Attributif direct — le verbe régit deux arguments : un sujet et un attribut du sujet.
  • Mairie est jolie.
  • Attributif indirect — le verbe régit trois arguments : un sujet, un complément et un attribut du complément.
  • Paul trouve Marie jolie.
  • Pronominal — le verbe régit au moins un pronom réfléchi.
  • Paul se lave.
  • Impersonnel :

Notes[modifier le wikicode]

  1. La dépendance est appelée expansion chez Martinet.
  2. L'interdépendance est appelée relation actualisateur-prédicat chez Martinet.
  3. L'indépendance est appelée coprésence chez Martinet.
  4. Le supérieur est appelé régisseur chez Tesnière.
  5. L'inférieur est appelé subordonné chez Tesnière.
  6. Le complément direct du verbe est un complément relié au verbe sans préposition.
  7. Le complément indirect du verbe est un complément relié au verbe avec préposition.

L'adverbe[modifier le wikicode]

Les catégories pro-lexicales[modifier le wikicode]

Les pro-noms[modifier le wikicode]

Les pro-adjectifs[modifier le wikicode]

Les pro-verbes[modifier le wikicode]

Les pro-adverbes[modifier le wikicode]

Les catégories grammaticales[modifier le wikicode]

Les catégories énonciatives[modifier le wikicode]

La macrostructure[modifier le wikicode]

Prolégomènes[modifier le wikicode]

Nous appellerons macrostructure l'organisation en articles des unités linguistiques.

Présentation[modifier le wikicode]

La macrostructure est à proprement parler le traitement lexicographique. C'est la méthodologie d'un dictionnaire. Elle repose sur un ensemble de choix épistémologiques qui se traduisent par des règles d'application. Tout d'abord, le dictionnaire choisit sa visée : linguistique, encyclopédique, générale, spécialisée, écrite, orale, monolingue, bilingue, etc. Cette visée oriente le lexicographe vers un corpus. En fonction de cet objectif, le dictionnaire choisira d'inclure certaines unités linguistiques et d'en exclure d'autres. Le dictionnaire choisit également les types d'unités linguistiques à indexer : mot, locution, expression, flexions, affixes, cooccurrences, etc. Une fois que les critères d'admissibilité sont clairement définis, le lexicographe obtient une liste d'unités linguistiques à traiter. Il les regroupe ensuite par lemmes. Et enfin, il établit la façon dont ils seront indexés dans le dictionnaire.

L'admission des glosses[modifier le wikicode]

Quelles unités linguistiques ?

Prolégomènes[modifier le wikicode]

Les glosses sont classés par morphes. Autrement dit, le traitement lexicographique adopté consiste à donner toutes les informations linguistiques d'une forme. Nous appellerons article ce développement lexicographique. Nous appellerons entrée le titre de cet article. Nous appellerons nomenclature l'ensemble des entrées.

Présentation[modifier le wikicode]

Quels sont les critères qui permettent d'admettre un glosse dans le Wiktionnaire ?

La compositionnalité[modifier le wikicode]

L'attestabilité[modifier le wikicode]

La prédictibilité[modifier le wikicode]

La lemmatisation des glosses[modifier le wikicode]

Variabilité morphique, sémique et taxique. Regroupement d'unités linguistiques.

L'indexation des glosses[modifier le wikicode]

Quel classement ? Comment indexer les dérivés, locutions, etc. ? Dégroupement ou regroupement ?

Références[modifier le wikicode]

  • Injoo Choi-Jonin, Corinne Delhay, Introduction à la méthodologie en linguistique : Application au français contemporain, Presses Universitaires de Strasbourg, Strasbourg, 1998, 312 pages ISBN 2-86820-003-6

La microstructure[modifier le wikicode]

La structure des articles n'est pas adéquate à la réalité linguistique.

Prolégomènes[modifier le wikicode]

Nous appellerons microstructure l'organisation interne d'un article.

L'étymologie[modifier le wikicode]

Présentation[modifier le wikicode]

L'étymologie étudie l'origine des mots en suivant leur évolution. C'est en quelque sorte l'Histoire des mots. La perspective est donc diachronique. En retraçant la filiation d'un mot, on cherche sa forme la plus ancienne : l'étymon. Au fil de l'évolution, un mot peut perdre toute homologie de forme et de sens avec son étymon. Par exemple, l'étymon de chèvre est capra : les deux mots n'ont plus aucun phonème en commun.
Par extension, l'étymologie est le résultat de cette étude : c'est la filiation d'un mot.

Pertinence[modifier le wikicode]

L'étymon du mot étymologie, ἐτυμολογία (etymología), signifie « recherche du vrai ». L'étymologie sert ainsi en tout premier lieu à retrouver le véritable sens des mots.

Problèmes[modifier le wikicode]

  • La présentation n'est pas uniforme.
  • L'étymologie est propre à chaque glossome. Or, dans la structure des articles, l'étymologie n'est hiérarchiquement pas inférieure à chaque glossome, mais égale au morphe. Exemple : botte.

Solutions[modifier le wikicode]

  • Établir un prototype.
  • Subordonner l'étymologie à chaque mot.

La morphologie[modifier le wikicode]

Présentation[modifier le wikicode]

La morphologie étudie la structure interne des mots. La perspective est donc synchronique.
Par extension, la morphologie est le résultat de cette étude : c'est la construction d'un mot.
Exemple : anticonstitutionnellement, fleuriste. Confusion entre le lemme et sa forme : être = forme de l'infinitif.

Pertinence[modifier le wikicode]

  • Permet de générer automatiquement les dérivés.

Problèmes[modifier le wikicode]

  • La morphologie est souvent confondue avec l'étymologie.

Solutions[modifier le wikicode]

  • Intégration d'une section Morphologie hiérarchiquement inférieure à chaque mot.
  • Spécification des définitions hyperonymiques : {{dh}}.

Les emplois[modifier le wikicode]

Présentation[modifier le wikicode]

Problèmes[modifier le wikicode]

  • Les verbes pronominaux sont dégroupés.

Solutions[modifier le wikicode]

  • Création d'une section intermédiaire Emplois.

Références[modifier le wikicode]

  • Injoo Choi-Jonin, Corinne Delhay, Introduction à la méthodologie en linguistique : Application au français contemporain, Presses Universitaires de Strasbourg, Strasbourg, 1998, 316 pages ISBN 2-86820-003-6

Résolution[modifier le wikicode]

Glossaire[modifier le wikicode]

A

  • Allo- : Variante libre d'un glosse.
  • Allographèmes : Graphèmes ayant les mêmes fonctions d'U.M.D.
  • Dans |paraitre|, \(i)\ et \(î)\ ont les mêmes fonctions linguistiques : \paraitre\ et \paraître\. Ce sont donc des allographèmes.
  • Allographes : Glossèmes paragraphiques, homosémiques et homotaxiques.
  • |poïkilo-| et |pœcilo-| ont les mêmes sèmes et taxes, et quasiment les mêmes graphes : \poïkilo\ et \pœcilo\. Ce sont donc des allographes.
  • Allomorphèmes : Morphèmes ayant les mêmes fonctions d'U.M.D.
  • Allomorphes : Glossèmes paramorphiques, homosémiques et homotaxiques.
  • Allophonèmes : Phonèmes ayant les mêmes fonctions d'U.M.D.
  • Dans |râteau|, /(ʁ)/ et /(ʀ)/ ont les mêmes fonctions linguistiques : /ʁato/ et /ʀato/. Ce sont donc des allophonèmes.
  • Allophones : Glossèmes paraphoniques, homosémiques et homotaxiques.
  • Allosèmes e : Glossèmes homomorphiques, parasémiques et homotaxiques.
  • Dans Le palais est en construction et Voici la nouvelle construction de l'architecte, les glossèmes |(construction)| ont les mêmes morphes et taxes, et quasiment les mêmes sèmes : [action de construire] et [résultat de construire].
  • Allotaxes : Glossèmes homomorphiques, homosémiques et parataxiques.
  • Dans Paul est sur Internet et Paul est sur l'Internet, les glossèmes |(Internet)| ont les mêmes morphes et sèmes, et quasiment les mêmes exotaxes : <>-déterminant<> et <>+déterminant<>. Ce sont donc des parataxes.

C

  • Combinaison : Environnement d'une unité dans un énoncé.

D

  • Diagraphe : Ensemble des graphes d'un glosse.
  • Diamorphe e : Ensemble des morphes d'un glosse.
  • Diaphone : Ensemble des phones d'un glosse.
  • Diasème e : Ensemble des sèmes d'un glosse.
  • Diataxe : Ensemble des taxes d'un glosse.
  • Distribution : Ensemble des possibilités combinatoires d'une unité.

E

  • -ème : Au niveau méroglossique, unité minimale distinctive. Au niveau hologlossique, unité invariable.

G

  • Glosse : Association conventionnelle d'une forme, d'un sens et d'une distribution.
  • Transcription : |X|.
  • Glossème : Glosse minimal et invariable.
  • Transcription : |(X)|.
  • |(nénuphar)| associe un graphe \nénuphar\, un sème [plante aquatique nymphéacée] et un taxe <>nom commun<>. C'est donc un glossème.
  • |(nénufar)| associe un graphe \nénufar\, un sème [plante aquatique nymphéacée] et un taxe <>nom commun<>. C'est donc un glossème.
  • Glossome : Ensemble contigu de glossèmes, glosse variable.
  • Transcription : |{X}|.
  • |{nénufar}| associe deux graphes \nénufar\ et \nénuphar\, un sème [plante aquatique nymphéacée] et un taxe <>nom commun<>. C'est donc un glosse.
  • Glotte : Tout système linguistique autonome.
  • Grammème : Glossème d'ordre grammatical.
  • Graphe : Graphèmes d'un glosse.
  • Transcription : \X\.
  • Graphème : U.M.D. de forme graphique.
  • Transcription : \(X)\.
  • |bar| et |car| sont graphiquement discriminés par \(b)\ et \(c)\. Ce sont donc des graphèmes.
  • Graphis : Unité graphique extraglossique.
  • Graphomère : T.O.D. de graphèmes.
  • Transcription : \+-X\.

H

  • Hétérographes : Glosses ayant des graphes différents.
  • Les glosses |voiture| et |vert| ont des graphes différents : \voiture\ et \vert\. Ce sont donc des hétérographes.
  • Hétéromorphes : Glosses ayant des morphes différents.
  • Hétérophones : Glosses ayant des phones différents.
  • Les glosses |voiture| et |vert| ont des phones différents : /vwatyʁ/ et /vɛʁ/. Ce sont donc des hétérophones.
  • Hétérosèmes : Glosses ayant des sèmes différents.
  • Les glosses |table| et |rouge| ont des sèmes différents : [meuble] et [couleur]. Ce sont donc des hétérosèmes.
  • Hétérotaxes : Glosses ayant des taxes différents.
  • Les glosses |dormir|/nowiki></code> et <code><nowiki>|gentil| ont des taxes différents : <>verbe<> et <>adjectif<>. Ce sont donc des hétérotaxes.
  • Homographes : Glosses ayant les mêmes graphes.
  • |(voler)| = [dérober] et |(voler)| = [planer] ont les mêmes graphes. Ce sont donc des homographes.
  • Homomorphes e : Glosses ayant les mêmes morphes.
  • |(voler)| = [dérober] et |(voler)| = [planer] ont les mêmes morphes. Ce sont donc des homomorphes.
  • Homophones : Glosses ayant les mêmes phones.
  • |eau|, |haut| et |au| ont les mêmes phones : /o/. Ce sont donc des homophones.
  • Homosèmes e : Glosses ayant les mêmes sèmes.
  • |ictère| et |jaunisse| ont les mêmes sèmes. Ce sont donc des homosèmes.
  • Homotaxes : Glosses ayant les mêmes taxes.
  • Dans Paul mange une pomme, |pomme| a le même taxe que |fraise| et |saucisse|. Ce sont donc des homotaxes.
  • Homotaxomes : Glosses ayant les mêmes taxomes.

L

  • Lexème : Glossème d'ordre lexical.

M

  • -mère : Au niveau méroglossique, trait ontologique distinctif.
  • Méroglosse : Composante du glosse.
  • Morphe : Forme d'un glossème.
  • Transcription : \X\/X/.
  • Morphème : U.M.D. de morphes.
  • Morphis : Unité formelle extraglossique.
  • Morphome : Morphes d'un glossome.
  • Morphomère : T.O.D. de morphèmes.

N

  • Niveau extraglossique : Niveau d'analyse sans considération du glosse.
  • Niveau hologlossique e : Niveau d'analyse du glosse par son ensemble.
  • Niveau intraglossique : Niveau d'analyse relativement au glosse.
  • Niveau méroglossique e : Niveau d'analyse du glosse par ses parties.

O

  • -ome : Au niveau méroglossique, ensemble. Au niveau hologlossique, unité variable.

P

  • Paragraphes : Glossèmes ayant quasiment les mêmes graphes.
  • |nénufar| et |nénuphar| ont quasiment les mêmes graphes : \nénufar\ et \nénuphar\. Ce sont donc des paragraphes.
  • Paramorphes : Glossèmes ayant quasiment les mêmes morphes.
  • Paraphones : Glossèmes ayant quasiment les mêmes phones.
  • Parasèmes : Glossèmes ayant quasiment les mêmes sèmes.
  • |prune| et |mirabelle| ont quasiment les mêmes sèmes : [-jaune] et [+jaune]. Ce sont donc des parasèmes.
  • Parataxes : Glossèmes ayant quasiment les mêmes taxes.
  • |mamie| et |papi| ont quasiment les mêmes taxes : <>+féminin<> et <>+masculin<>. Ce sont donc des parataxes.
  • Phone : Phonèmes d'un glossèmes.
  • Transcription : /X/.
  • Phonème : U.M.D. de forme phonique.
  • Transcription : /(X)/.
  • |bar| et |car| sont phoniquement discriminés par /(b)/ et /(k)/. Ce sont donc des phonèmes.
  • Phonis : Unité phonique extraglossique.
  • Phonomère : T.O.D. de phonèmes.
  • Transcription : /+-X/.
  • Les phonèmes /(p)/ et /(b)/ sont phoniquement discriminés par le voisement : /-voisé/ et /+voisé/. C'est donc un phonomère.

S

  • Sème e : Sens d'un glossème.
  • Transcription : [X].
  • Sémème e : U.M.D. de sèmes.
  • Transcription : [(X)].
  • |chaise| et |tabouret| sont sémiquement discriminés par [+dossier] et [-dossier]. C'est donc un sémomère.
  • Sémis : Unité conceptuelle extraglossique.
  • Sémome : Sèmes d'un glossome.
  • Sémomère : T.O.D. de sémèmes.
  • Transcription : [+-X].
  • Syngraphe : Ensemble maximal d'homographes.
  • Symorphe : Ensemble maximal d'homomorphes.
  • Synphone : Ensemble maximal d'homophones.
  • Synsème : Ensemble maximal d'homosèmes.
  • Syntaxe : Ensemble maximal d'homotaxes.

T

  • Taxe e : Distribution d'un glossème.
  • De |τάξις| = /taksis/ + [disposition].
  • Transcription : <>X<>.
  • |maison| a pour taxe <>nom commun<>.
  • Taxème : U.M.D. de taxes.
  • Transcription : <>(X)<>.
    • Dans Paul est un grand musicien, |grand| a pour taxème <>(épithète préposé)<>.
  • Taxis : Unité distributionnelle extraglossique.
  • Taxome : Taxes d'un glossome.
  • Taxomère : T.O.D. de taxèmes.
  • Transcription : <>+-X<>.
  • Dans Paul nage et Paul nage le crawl, les deux glossèmes |(nage)| sont taxiquement discriminés par <>-transitif direct<> et <>+transitif direct<>. C'est donc un taxomère.
  • Trait ontologique distinctif (T.O.D.) : Propriété d'opposition binaire constitutive d'une U.M.D.

U

  • Unité minimale distinctive (U.M.D.) : Élément qui permet de discriminer les glossèmes entre eux.

Notes[modifier le wikicode]

  1. Le sémème est appelé sème en sémantique classique. Nous avons choisi de respecter le sens analogique du suffixe -ème : unité minimale distinctive.
  2. Le sème est appelé sémème en sémantique classique. Ici, sème est un radical, étymologisé de σῆμα, et non une suffixation en -ème, ce qui en fait une unité non distinctive, contrairement au sémème.
  3. Les allosèmes sont appelés acceptions en linguistique classique.
  4. La diamorphie
  5. La diasémie est appelée polysémie en linguistique classique.
  6. Les homomorphes sont appelés homonymes en lexicologie classique.
  7. Les homosèmes sont appelés synonymes en lexicologie classique.
  8. Le niveau hologlossique est appelé première articulation en linguistique fonctionnelle.
  9. Le niveau méroglossique, dans sa composante formelle, est appelé deuxième articulation en linguistique fonctionnelle.
  10. Le taxe est appelé classe distributionnelle ou classe morphosyntaxique ou nature grammaticale en linguistique classique.