Discussion Wiktionnaire:Statistiques/Archive 2006

Le contenu de la page n’est pas pris en charge dans d’autres langues.
Définition, traduction, prononciation, anagramme et synonyme sur le dictionnaire libre Wiktionnaire.

Il pourrait être intéressant de connaitre aussi le nombre d'article qui possèdent une image illustrative ou une prononciation sonore (ou juste API). - Dakdada (discuter) 16 décembre 2005 à 12:08 (UTC)[répondre]

Arg pour API ça aurait été plus facile sans la ligne *{{API}} : // vide ---moyogo 16 décembre 2005 à 12:58 (UTC)[répondre]
pour API, j'ai déjà une expression régulière, je crois qu'en gros, il suffit de matcher /\* *\{\{API\}\} *: *\/.+\// . Euh, de mémoire, maintenant, il faut vérifier que ça marche hein ;-)

Est-ce qu'on inclu aussi les {{-car-}} dans les stats ? J'ai l'impression qu'ils n'y sont pas actuellement. Aussi, faut-il renommer -car- en =car= ? --Utilisateur:Kipmaster 16 décembre 2005 à 13:15 (UTC)[répondre]

« car » est le code d'une langue du Venezuela. ---moyogo 16 décembre 2005 à 13:17 (UTC)[répondre]
Zuteuh ! --Utilisateur:Kipmaster 16 décembre 2005 à 13:25 (UTC)[répondre]

Stats wiki par wiki[modifier le wikicode]

Je propose de mettre à jour régulièrement les statistiques wiki par wiki, comme par exemple tous les 1ers du mois comme aujourd'hui. Kwak, le 2006-02-01 @625

En fait, on met à jour les statistiques dès qu'on peut, c'est-à-dire à chaque fois qu'un nouveau dump est disponible. Le dernier dump disponible était celui du 13 décembre jusqu'à hier (31 janvier, nouveau dump !), on devrait donc pouvoir calculer enfin des nouvelle stats Kipmaster 1 février 2006 à 14:13 (UTC)[répondre]
Ces statistiques ne semblent pas correspondre au 31 janvier. Par exemple, Madagasikara existe depuis le 2 janvier, et pourtant le malgache est encore indiqué comme langue orpheline. Ou alors, y a-t-il un autre problème ? Lmaltier 18 février 2006 à 16:40 (UTC)[répondre]

Stats...nom,verbe...[modifier le wikicode]

Je me demandais seulement d'où venaient les chiffres pour les statistiques des colonnes de noms, verbes, adv, etc. Et pourquoi lorsque l'on additionne tout ces chiffres on arrive à 60 000 définitions tandis qu'il existe 180 000 définitions dans le wikitionnaire au complet.  LINCHER  (PSSST)  6 mars 2006 à 01:34 (UTC)[répondre]

Je pense que tu as oublié d'aditionner les 90 000 noms communs ;-). Par contre, on reste toujours en dessous des 180 000 alors qu'on devrait dépasser ce chiffre. Il manque les locutions peut-être ? Kipmaster 6 mars 2006 à 08:18 (UTC)[répondre]
En fait, je crois que bcp de gens ont ajoutés des articles sans y ajouter de catégorie et puisque la page Special:Uncategorizedpages est rempli de sinogramme non-catégorisé, on remarque que c'est ce qui se passe. En plus, le « cutoff » de cette page spéciale est de 400 seulement alors pour faire le ménage dans cette page c'est pas long et dieu sait qu'il doit y en avoir plus que 400 articles non-catégorisés.  LINCHER  (PSSST)  6 mars 2006 à 18:01 (UTC)[répondre]
Un petit compte dans le dernier dump me donne : 3060 articles sans catégories. Voir Utilisateur:Darkdadaah/Pages sans catégorie pour ces pages. - Dakdada (discuter) 6 mars 2006 à 18:18 (UTC)[répondre]

Problèmes dans les stats[modifier le wikicode]

Je vois deux problèmes :

  • problème d'ordre : par exemple, l'espéranto devrait être mieux placé. Ce classement est-il fait automatiquement.
  • problème de chiffres : par exemple, le polonais est mentionné pour un seul article, alors qu'il y en a en réalité beaucoup.

Il serait bien de voir d'où ça vient... Lmaltier 15 avril 2006 à 13:33 (UTC)[répondre]

Le polonais apparait en double en fait... Kipmaster 15 avril 2006 à 14:12 (UTC)[répondre]
les langues sont classées par taille du contenu et non par nombre d'articles. Pour des raisons basement techniques la somme de la taille des deux périodes comparées est prises en compte. Ainsi l'hébreu est surclassé du fait que les articles comprennent beaucoup de ref et l'esperanto est sous classé du fait de la concision des articles.
Lorsqu'il apparait qu'une langue est présente deux fois, cela signifie en général qu'il y a deux codes de langues actifs. C'est ainsi le cas actuellement pour {{kin}} et {{rw}} qui se transforme en kinyarwanda et kinyarwanda. Cela peut être dû à une erreur ou à une recodification du code langue. LBO disc 22 mai 2006 à 08:10 (UTC)[répondre]

Je pense qu'il serait intéressant de savoir quelle proportion (en pourcents) des articles les langues occupent. C'est possible de le faire au prochaines statistiques ? :-) (un petit résumé en début ou en fin de tableau suffirait) - Dakdada (discuter) 7 juillet 2006 à 19:46 (UTC)[répondre]

Oui, ça serait bien, pour avoir une idée sans faire le calcul. Lmaltier 22 juillet 2006 à 16:38 (UTC)[répondre]

les proportions en nombre d'article ou en nombre d'octet ? Kipmaster 23 décembre 2006 à 15:29 (UTC)[répondre]
Hum les deux je pense :) - Dakdada (discuter) 23 décembre 2006 à 16:02 (UTC)[répondre]
C'est certainement possible. On peut aussi envisager une refonte complète des stats. Cela fait plus d'un an que la structue n'a pas changé. LBO disc 23 décembre 2006 à 16:42 (UTC)[répondre]
On pourrait en profiter pour ajouter un classement alphabétique par langue (pour que ceux qui s'intéressent à une langue puissent savoir facilement dans quelle mesure le Wiktionnaire a déjà traité cette langue). Lmaltier 23 décembre 2006 à 16:59 (UTC)[répondre]

Codes langues[modifier le wikicode]

J'ai changé le code div en code dv (code ISO en 2 lettres). On peut aussi rajouter le code pag (pangasinan). Lmaltier 22 juillet 2006 à 16:37 (UTC)[répondre]

Le Niçois manque à votre liste. Vousavez le ligure, le piémontais, le catalan, le maltais, je pense donc que le niçois, qui est une langue d'oc à part entière a sa place sur cette liste. - (IP)

Ne figurent dans les statistiques que les langues qui ont des mots décrits dans le Wiktionnaire... Par ailleurs, contrairement au ligure, au piémontais, etc., le niçois n'a pas de code attribué par l'ISO (parce que considéré comme faisant partie de l'occitan). Ceci dit, cela ne me choquerait pas, personnellement, de créer un code du style oc-nic pour le niçois, mais il faut d'abord vérifier si les mots occitans déjà créés forment une catégorie cohérent : Catégorie:occitan. Peut-être y a-t-il des mots spécifiquement niçois parmi eux ? Lmaltier 22 décembre 2006 à 18:22 (UTC)[répondre]