Projet:Coopération/Logoscope/Notice

Définition, traduction, prononciation, anagramme et synonyme sur le dictionnaire libre Wiktionnaire.

Notice de validation des néologismes pour la base Logoscope[modifier le wikicode]

Cette notice de validation est une aide à la décision. Elle donne des critères qualitatifs pour identifier, parmi les néologismes-candidats fournis en sortie par la machine, les bons néologismes qui doivent être documentés dans la base Logoscope.

À partir de janvier 2016, le critère quantitatif d’acceptation d’un néologisme est fixé à 2000 occurrences sur Google. Il était à 10 000 pour les mois précédents. La base Factiva sert aussi principalement pour mesurer l’usage des emprunts, le taux de diffusion des mots anglais étant difficilement observable sur Google.

Syntaxe de l’annotation[modifier le wikicode]

0/1, attribut morphosyntaxique, procédé(s) Précisions :

1 signifie que le candidat est validé, 0 qu’il est écarté
L’attribut morphosyntaxique est toujours unique
Quand il y a plusieurs procédés à annoter, ils n’ont pas à être ordonnés.

Les attributs morphosyntaxiques[modifier le wikicode]

On annote les formes néologiques en fonction de leurs emplois

Attribut Signification Remarques
NOM Nom On ne prend en compte que les formes effectivement en emploi nominal.
NP Nom propre La présence de majuscule n’est pas toujours un élément fiable, tout comme l’absence de détermination. Pas de signification en langue, non lié à des traits sémantiques, mais un acte de prédication, de désignation. Le NP est tourné vers la recherche d'un élément unique, individuel, et il est lié cognitivement aux caractéristiques propres à ce référent unique, par un acte de baptême (un lien fixe et rigide).
ADJ Adjectif Les composés de deux noms (éventuellement deux noms propres) en fonction d’épithète seront annotés avec cet attribut. De même que les PPR devenus des adjectifs verbaux, en -ant (ex. des Nikes autolaçantes).

Parce que trop courants et systématisés, les adjectifs composés dérivés de pays ne sont pas sélectionnés, sauf les adjectifs utilisant la réduplication (ex. tuniso-tunisien).

ADV Adverbe Catégorie assez peu représentée, à part quelques adverbes de manière (en -ment).
V Verbe Toutes les formes verbales, quel qu’en soit le temps ou le mode. Cette étiquette comprend notamment les participes passés des temps composés.
PP Part. passé Participes passés associés à des noms. Entendu au sens large : les formes en -é, -i (tant que la forme n’est pas déjà adjectivée en langue), ainsi que l’adjectif verbal en –(a)ble. Attention : les unités qualifiant un NOM, mais déjà adjectivées en langue, ne seront pas notées PP mais ADJ, malgré leur terminaison en « -é », par exemple.  
PPR Part. présent Participes présents associés à des noms.
GER Gérondif
INT Interjection
PRON Pronom Catégorie assez peu représentée, souvent en emploi métalinguistique.
PRE Préposition Catégorie assez peu représentée, souvent en emploi métalinguistique.

Les Procédés[modifier le wikicode]

  • MORSEM

Procédés morphosémantiques de création néologique, mettant en jeu des morphèmes autonomes ou non : affixation, flexion, composition, mots-valises, etc...

  • MORSEM,ONO

Onomatopées : forme graphique nouvelle liée à un référent sonore. N.B. : on n'utilise pas l’attribut ONO seul, mais toujours associé à MORSEM.

  • SYNSEM

Procédés syntacticosémantiques, affectant la catégorie morphosyntaxique d’un terme préexistant (pouvant lui-même être néologique ou largement diffusé et lexicalisé), sans toucher à sa forme : conversion, néologismes sémantiques.

  • MORPH

Procédé morphologique, n’affectant que la forme d’un terme préexistant (néologique ou non) : reduplication (d’une lettre, d’une syllabe, d’un morphème, etc.), troncation, siglaison, acronymes, fausse coupe, paronymie (par exemple graphie référant à une prononciation particulière).

  • EMP

Emprunts : emploi dans un contexte français d'une forme appartenant à une autre langue. Uniquement pour les terme n'étant pas déjà intégrés dans le lexique français. N.B. :

  • même si l’emprunt est néologique dans la langue-source, on n’annote pas le(s) procédé(s) qui ont donné lieu à sa création. En revanche, dans le cas des emprunts assimilés, on annote les procédés morphosémantiques, morphologiques ou syntacticosémantiques qui modifient (en français) la forme empruntée.
  • les termes appartenant à une langue de spécialité ou une langue régionale liées au français ne sont pas considérés comme des emprunts, à moins qu’ils ne correspondent à une création
  • LOG

Certains mots, aussi appelés « non-mots » et « pseudo-mots », ne sont pas étiquetables avec un procédé particulier. Il peut s’agir en particulier de noms de marque, de robots, etc. (balisto, luvo, etc.). Pour ces logatomes construits sans référence à la morphologie d’une langue identifiable, nous attribuons l’étiquette LOG à la place d’une étiquette de procédé.

Remarque : Les procédés peuvent se combiner entre eux (jusqu'à trois).


La validation des candidats à la néologie[modifier le wikicode]

Cinq critères

Critères Candidat validé Candidat rejeté
Cotexte Mot présent dans un cotexte suffisant pour en saisir le sens et la portée Cotexte absent, insuffisant, ou mot absent du cotexte.
Lexicographie Mot absent des dictionnaires (condition nécessaire mais non suffisante) Mot intégré à la dernière édition du Robert ou du Larousse
Diffusion Mot faiblement diffusé : nombre restreint d'attestations dans Google, Bing et/ou Factiva. Mot largement diffusé : nombre important d'attestations dans Google, Bing et/ou Factiva (mais la diffusion n’est pas forcément proportionnelle au nombre d’occurrences : cas de création multiple spontanée).
Temporalité Mot existant depuis moins d'un an (même s’il est largement diffusé) Mot existant en nombre depuis plusieurs années, critiqué par le bon usage, appartenant au dictionnaire…
Jeu de mots traditionnel (critère de la temporalité ET de la diffusion combinés)
Variation Néologisme apparaissant dans une variété de français, ou dans un domaine de spécialité Mot appartenant (en grand nombre depuis longtemps) à une variété de français, ou à un domaine de spécialité, et se diffusant dans le français standard

Cinq cas particuliers

Cas particuliers Candidat validé Candidat rejeté
Emprunts Emploi d'un terme étranger intégré à la syntaxe du français dans un cotexte français Attestation en langue étrangère, intégré dans une phrase en langue étrangère
Emploi métalinguistique d'un terme étranger (simple mention du terme, accompagné d'une définition / traduction)
Emprunt largement intégré, diffusé et/ou connu en français
Graphie Variante graphique (consciente ou non) d'un mot connu, pouvant exprimer une prononciation particulière, un accent particulier, une intégration au système morphologique du français dans le cas des emprunts, etc.
Variante graphique d'un néologisme
Fautes de frappe ou d'orthographe
Variante graphique d'un mot connu et diffusé
Traits d’union Ajout de traits d’union à l’intérieur d’un mot connu (néologie graphique) Mot composé sans trait d'union (non repéré par le Logoscope)
Phrase à trait d’union (non intégré comme élément lexical au sein d’une phrase)
Noms Propres Composé de deux noms propres, construction, ou mot valise, etc… Nom propre de personne ou de lieu non français : pas un néologisme
Préfixes productifs Moins de 5 000 résultats sur Google Plus de 5 000 résultats sur Google