Discussion module:langues/lettres rares

Le contenu de la page n’est pas pris en charge dans d’autres langues.
Définition, traduction, prononciation, anagramme et synonyme sur le dictionnaire libre Wiktionnaire.

Lettres pas rares[modifier le wikicode]

Certaines des lettres données sont loin d'être rares : ê, ç, î etc. ? Il y a clairement un problème dans ce qu'on appelle une lettre rare, et c'est dommage de ne pas avoir discuté de ces listes avant de modifier les modules (ou alors je n'ai pas vu où). — Dakdada 6 janvier 2015 à 17:33 (UTC)[répondre]

Bonne année à toi Darkdadaah (d · c · b).
Tu aurais pu aussi parler de isolated silliness à l'encontre de celui qui a osé publier automatiquement tout ceci en y incluant le nombre de mots en français avec des "é" ;)
Et pourtant ça tourne rond pour la simple et bonne raison que nous devons tous parler en connaissance de cause. Je m'explique : si le "é" est une lettre latine relativement rare dans l'ensemble des langues latines, le fait que pour le français elle figure dans 341 342 de nos 1 366 145 articles, soit 4,00 % ! Ne laisse aucune place à la pifométrie. Nous pourrions donc maintenant retirer toutes les lettres de moins de 1 % sans risquer que pour le français certaines à 2 % et pour l'anglais la moins rare à 0,001 car les critères des contributeurs seraient différents... JackPotte ($) 6 janvier 2015 à 19:28 (UTC)[répondre]
341 342 de nos 1 366 145 articles, ça ne ferait pas plutôt 25 % que 4,00 % ? — Automatik (discussion) 6 janvier 2015 à 19:58 (UTC)[répondre]
Oups, le compteur Lua n'est pas encore au point. JackPotte ($) 6 janvier 2015 à 20:02 (UTC)[répondre]
D'ailleurs sans Lua malheureusement, {{PAGESINCATEGORY:français}}/{{PAGESINCATEGORY:é en français}} marche (1 983 855/0),
{{#expr:100*341346/1366204}} fonctionne (24.984994920232),
mais pas {{#expr:100*{{PAGESINCATEGORY:français}}/{{PAGESINCATEGORY:é en français}}}} (Erreur d’expression : caractère de ponctuation «   » non reconnu.).
Ni avec é, ni {{URLENCODE:é}}.
Cela aurait pu déboucher sur une catégorie de maintenance "lettres rares répandues". JackPotte ($) 6 janvier 2015 à 20:37 (UTC)[répondre]
{{#expr:100*{{formatnum:{{PAGESINCATEGORY:é en français}}|R}}/{{formatnum:{{PAGESINCATEGORY:français}}|R}}}} → 0 (cf. mw:Help:Extension:ParserFunctions/fr#.23expr). — Automatik (discussion) 6 janvier 2015 à 22:59 (UTC)[répondre]
On n'avait pas besoin de mettre en place une méthode aussi lourde pour compter les mots qui contiennent certaines lettres : il y a des méthodes bien plus efficaces que ça. Au début j'avais compris qu'on ne ferait que quelques catégories avec un nombre réduit d'articles, mais si ce n'est pas le cas alors je m'oppose à l'utilisation de cette méthode dans le Module:section langue. Ce n'est pas pour rien qu'on demande à ce que ce genre de modifications importantes soient discutées avant. — Dakdada 7 janvier 2015 à 09:48 (UTC)[répondre]
Je veux bien te croire mais tu ne m'as pas convaincu sur le besoin de la communauté. Je vais donc lancer le vote sur le ratio dès que j'aurais la certitude que le cache du serveur a bien été totalement renouvelé. JackPotte ($) 7 janvier 2015 à 18:46 (UTC)[répondre]
PS : si quelqu'un trouve insupportable la présence de Catégorie:é en français pendant ces quelques jours je ne verrais aucun inconvénient à y ajouter __HIDDENCAT__. JackPotte ($) 7 janvier 2015 à 18:58 (UTC)[répondre]
Je n'ai vu nulle part de besoin de la communauté pour ça : je ne crois pas que tu ais posé la question de manière suffisamment visible. Ça aurait été bien que tu lances un vote avant de faire les modifications (qui ont impacté toutes les pages). — Dakdada 8 janvier 2015 à 15:31 (UTC)[répondre]

Décomptes[modifier le wikicode]

J'ai fait un décompte des lettres utilisées dans les mots en français en analysant un dump : Utilisateur:Darkdadaah/Listes/Lettres fr (script database_analysis.pl de anagrimes). On peut déterminer de cette manière quelles sont les lettres rares. — Dakdada 9 janvier 2015 à 18:17 (UTC)[répondre]

On ne va pas créer une catégorie pour chaque lettre ayant 1 ou 2 occurrences, c'est pourquoi je propose de les placer dans la racine de Catégorie:Lettres rares en français via une exclusion en Lua des lettres actuelles plus [^a-zA-Z]. JackPotte ($) 10 janvier 2015 à 00:14 (UTC)[répondre]
Je viens de voir que Utilisateur:Darkdadaah/Listes/Lettres fr ne compte pas le nombre de mot ayant au moins une lettre mais le nombre de lettres dont certaines figurent plusieurs fois par mot. C'est pourquoi je n'en n'ai pas parlé dans la nouvelle prise de décision qui pointe de toute façon vers la présente page. JackPotte ($) 10 janvier 2015 à 19:03 (UTC)[répondre]
J'ai fait ça assez rapidement, mais suite à ta remarque j'ai mis à jour le décompte. — Dakdada 14 janvier 2015 à 18:36 (UTC)[répondre]
Bonus : Utilisateur:Darkdadaah/Listes/Lettres en. — Dakdada 14 janvier 2015 à 18:43 (UTC)[répondre]
Merci. JackPotte ($) 14 janvier 2015 à 18:52 (UTC)[répondre]