Wiktionnaire:Maintenance et nettoyage
|
Cette page est là pour lister les pages suspectes où incomplètes du Wiktionnaire. Le Wiktionnaire croît très rapidement mais cela se fait forcément au détriment de la cohérence et de l'homogénéité de l'ensemble. Les contributeurs expérimentés sachant formater une page ne sont pas assez nombreux pour tout suivre et certaines pages intéressantes mais mal mises en forme passent à travers les mailles du filet. De même, certaines conventions ont changé sans que toutes les pages soient modifiées. Cette page a pour but de recenser les différents types d'erreur que l'on peut trouver automatiquement, afin de permettre à l'éditeur voulant nettoyer un peu de trouver facilement de quoi s'occuper. Certaines listes comportent des milliers de pages, mais on a le temps pour les finir et toutes les petites contributions aident. Ici vous pouvez voir :
Si vous avez un problème qui vous tient à cœur, vous pouvez aussi en parler pour voir ce qui est faisable. |
| Wiktionnaire:Maintenance et nettoyage (C) |
|---|
| Gestion des catégories | Gestion des modèles | Pages à formater | Pages à fusionner |
| Pages à supprimer rapidement | Pages proposées à la suppression | Pages proposées au renommage | Wikidémie |
[modifier] Tâches ponctuelles
- Spécial:Pages_liées/Modèle:-loc- : Changer toutes les occurences du modèle {{-loc-}} en un modèle plus précis ({{-loc-nom-}}, {{-loc-adj-}}, etc.) Voir la liste des types de mots pour connaître tous les types de locutions du Wiktionnaire
- environ 300 pages le 14/03/09
- 175 pages le 04/04/09
- 118 pages le 20/04/09
- 74 pages le 08/09/2009
- environ 300 pages le 14/03/09
- Wiktionnaire:Maintenance et nettoyage/traductions à séparer : Créer des boîtes pour accueillir les traductions correspondant à des sens différents.
- Concrètement, cela veut dire :
- Ajouter {{boîte début|''Un petit résumé de la définition''}} {{boîte fin}} autant de fois qu'il y a de sens.
- Trier selon le sens toutes les traductions que l'on connait
- Ajouter {{trad-trier}} au-desɹsus des traductions non triées restantes
- En théorie, ajouter l'argument trier au modèle {{T}} pour les traductions restant à trier, mais c'est fastidieux et mon bot pourra le faire.
- 6433 pages le 12/03/08, seules les 500 premières sont affichées
- Concrètement, cela veut dire :
[modifier] Catégories
Les catégories sont remises automatiquement à jour donc vous êtes sûr que si un mot est là, c'est qu'il a un problème ;o)
- Catégorie:Wiktionnaire:Traductions à trier, et toutes les sous-catégories par langue
- Souvent les éditeurs qui ajoutent des traductions ne précisent pas à quel sens du mot se rapporte la définition. Il s'agit de corriger cet oubli qui diminue fortement l'intérêt des traductions. Cette catégorie contient beaucoup d'article et ce nombre devrait encore fortement augmenter car on devrait être plus rigoureux sur ce point.
- Catégorie:Wiktionnaire:Flexions à vérifier
- Cette catégorie recense les verbes incomplets, où il manque des pages de flexion.
- 8939 pages le 25/12/08
- 9346 pages le 20/04/09
- Catégorie:Mots de type indéterminé
- Catégorie:Wiktionnaire:Codes langue manquants
- Catégorie:Pages à formater
- Contrairement aux catégories précédentes, cette catégorie est remplie manuellement, par l'ajout du modèle {{formater}} sur les pages posant problème. Elle indique des pags dont le format général est à revoir.
- 114 pages le 25/12/08
- 49 pages le 04/04/09
- 66 pages le 20/04/09
- Catégorie:Pages à fusionner
- Les pages qui font doublons, qu'on doit réunir en une page sans perdre d'information. Peu d'articles mais souvent des modifications complexes.
- 9 pages le 25/12/08
- 15 pages le 04/04/09
- 3 pages le 20/04/09
- Catégorie:Genres manquants
- Catégorie:Wiktionnaire:Terminologie sans langue précisée
- Catégorie:Pages avec des liens de fichiers brisés
- Ces pages contiennent un lien vers un fichier qui n’existe pas. Vérifier que le nom est le bon, qu’il n’existe pas un fichier similaire qui pourrait le remplacer ou que vous ne pouvez pas créer vous-même un fichier (son, photo, ...) qui pourrait convenir. Si rien de tout ça ne fonctionne, alors on peut retirer le lien en question qui n’a pas lieu d’exister.
Je n'ai mis ici que les principales catégories. Vous pouvez voir dans Catégorie:Maintenance du Wiktionnaire toutes les autres, indiquant des problèmes plus rares, moins importants ou liés à une langue.
[modifier] Pages spéciales
Les pages spéciales sont maintenues automatiquement par le logiciel mais ne sont pas automatiquement à jour comme les catégories. Elles sont aussi moins adaptées à la structure du Wiktionnaire et donc parfois moins utiles.
- Spécial:Pages sans catégorie
- Les pages n'ayant aucune catégorie. Cela veut dire qu'il manque des modèles indiquant le type grammatical.
- 38 pages le 24/12/08
- Il y en a quelques uns qui point simplement vers un autre article, sans être une redirection. Pourquoi devrait-on les laisser comme ça ? Mglovesfun 4 avril 2009 à 11:36 (UTC)
- Je nettoie cette catégorie chaque jour, il s'agit souvent d'un essai d'un débutant, ou d'une « blague ». Mglovesfun 26 avril 2009 à 10:31 (UTC)
- Spécial:Pages en impasse
- Pages n'ayant aucun lien.
- 0 page le 24/12/08
- Spécial:Pages orphelines
- Pages n'ayant aucun lien vers elles
- Beaucoup le 04/04/09, mais ce n'est pas un problème énorme. Mglovesfun 4 avril 2009 à 11:35 (UTC)
- Spécial:Liste des redirections
- Certaines sont à conserver, certaines à supprimer et certaines méritent un article complet (exemple). Mglovesfun 22 mai 2009 à 14:58 (UTC)
[modifier] Analyse de dump
Un dump est un fichier téléchargeable contenant l'ensemble du wiktionnaire. Ils sont générés environ une fois par mois en ce moment et disponibles sur http://download.wikimedia.org/
Koxinga a écrit un petit programme pour analyser les dumps, qu'il essaiera de faire tourner à intervalle régulier (il y a un dump tous les un/deux mois). Il a peu jeté l'éponge, mais n'hésitez pas à lui demander si vous voulez reprendre le flambeau.
[modifier] Nettoyage
Si vous avez nettoyé un peu, supprimez ce que vous avez fait de la liste, c'est le plus simple !
Ces sections ont un nombre plus important d'articles problématiques, mais ce nombre devrait progressivement baisser. C'est juste que nous avons quatre ans de petites erreurs qui s'accumulent, ça finit par faire beaucoup ...
[modifier] Appels de modèles inexistants
Encore quelques faux positifs, mais une grande majorité de problème réels. J'ai enlevé les appels aux variables mediawiki (PAGENAME, etc.) mais j'ai laissé les appels aux fonctions de parseur (#if, etc.) qui n'ont rien à faire dans l'espace principale.
Les CLEFDETRI isolés en bas de page pourront être traités par un bot, concentrez vous sur les cas demandant une intelligence humaine.
- Wiktionnaire:Maintenance et nettoyage/modèles inexistants
- 320 lignes (sans les CLEFDETRI)
- 40 lignes le 04/04/09 (sans les CLEFDETRI). Il faut quelqu'un qui connaît le grec, le grec ancien et le finnois pour pouvoir finir. Mglovesfun 4 avril 2009 à 11:31 (UTC)
- 320 lignes (sans les CLEFDETRI)
[modifier] Doublon de section H3
Le niveau H3, c'est le niveau des types grammaticaux, étymologie, etc.
- Wiktionnaire:Maintenance_et_nettoyage/doublon de section H3
- 1236 lignes
- 1180 lignes le 20/04/09
- 1165 lignes le 13/10/09
[modifier] Doublon de section H4
Le niveau H4, c'est le niveau des traductions, synonymes, dérivés, etc.
- Wiktionnaire:Maintenance_et_nettoyage/doublon de section H4
- 35 lignes
- 140 lignes le 20/04/09
- 0 le 27 septembre 2009 à 06:17 (UTC)
[modifier] Articles sans liens explicites (entre doubles crochets)
C'est souvent l'indice d'un problème, et toujours une raison pour laquelle ces articles sont exclus des statistiques. Pouvez rajouter au moins un lien explicite (entre doubles brochets), ou une catégorie ?
[modifier] Pages avec des définitions finissant par (1), (2), etc.
Certaines pages ont des définitions qui finissent par un numéro entre parenthèses faisant référence à un numéro d'ordre de définition. Ce numéro peut faire référence à une définition qui est dans la même page, ou dans une page différente, ou même dans un autre wiktionnaire (dans des cas d'importation par PiedBot). Il faudrait réécrire ces définitions pour que leur sens soit clair, et retirer ces numéros entre parenthèses. Note : les pages contenant adj-num sont éliminées, car le numéro entre parenthèses est susceptible d'être normal dans ces pages).
- Wiktionnaire:Maintenance et nettoyage/Numéros_dans_définitions
- 259 pages le 02/10/2009
- 112 pages le 26/10/2009
- 0 page le 10/12/2009
[modifier] Pages mal structurées
Un nouveau test, qui révèle beaucoup de pages, en regardant quelles sections4 sont dans quelles sections. Dites-moi s'il y a des pages correctes détectées, j'affinerai pour la prochaine fois.
- Wiktionnaire:Maintenance_et_nettoyage/Problème de structure
- 2028 lignes le 20/04/09, dont 1489 qui concernent la section pron, qui sont moins gênantes et ne sont pas affichées ici. Cela laisse donc 539 pages dans l'immédiat.
[modifier] Section H3 en dehors d'une section de langue
Souvent parce que la section de langue a été oubliée ou mal faite. Peut peut-être faire doublon avec d'autres listes.
- Wiktionnaire:Maintenance_et_nettoyage/Section H3 sans section de langue
- 123 lignes, mais les premières sont sur les unités de mesure, ce qui est un autre problème.
- 27 le 14 septembre 2009 à 18:44 (UTC), surtout les transcriptions (qu'on propose à la suppression). Mglovesfun (disc.) 14 septembre 2009 à 18:44 (UTC)
- 6 le 25 septembre 2009 à 10:11 (UTC) Mglovesfun (disc.)
- 27 le 14 septembre 2009 à 18:44 (UTC), surtout les transcriptions (qu'on propose à la suppression). Mglovesfun (disc.) 14 septembre 2009 à 18:44 (UTC)
- 123 lignes, mais les premières sont sur les unités de mesure, ce qui est un autre problème.
[modifier] Traductions d'un mot en langue étrangère
Liste des pages comportant un modèle trad, trad- ou trad+ dans une section de langue étrangère.
- Wiktionnaire:Maintenance_et_nettoyage/Modèle trad en section étrangère
- 1259 lignes au 24/09/09
[modifier] Problèmes divers
Voici enfin une liste contenant des problèmes peu fréquents, un pot-pourri de tout ce que le wiktionnaire a de pire en matière de formatage
. Sûrement des problèmes d'mportance très variables et de bons articles sélectionnés par erreur, n'hésitez pas à commenter le résultat.
1103 lignes le 20/04/09- 750 lignes le 07/05/09
[modifier] Redirections
Le robot (« bot ») DaftBot (d · c · b) a créé des milliers de redirections pour des flexions (surtout les pluriels et les féminins singuliers) entre 2004 et 2005. Il serait préférable de les « recréer » avec les modèles comme {{-flex-nom-}} et {{-flex-adj-}}. Une liste de toutes les redirections (limitée à 5000 lignes) se trouve se Spécial:Liste des redirections.
[modifier] Le Wiktionnaire anglais
Ne soyons pas sectaire, le wiktionnaire anglais a besoin d'aide aussi. Robert Ullmann fait aussi des analyses de dump et il a compilé une liste de pluriel, féminin, formes conjuguées en français dont le mot de base n'a pas de section français. Beaucoup sont des typos créées automatiquement.
Là-bas, {{supp}} est delete pour les cas évidents, rfd quand cela mérite discussion.
- en:User:Robert Ullmann/Missing forms/French
- 42 pages le 26/12/08
[modifier] Propositions d'analyse
L'analyse des dumps est un outil très puissant, encore plus si le wiktionnaire est bien rangé. Une fois que les problèmes les plus flagrants auront été réglés ou réduits, on peut préciser l'analyse, par exemple spécialiser par langue. Si vous avez un problème particulier, n'hésitez-pas à en parler. Beaucoup de choses sont possibles, surtout si on reste en consultation et qu'on peut se tromper une fois de temps en temps. On peut essayer des choses que l'on n'oserait pas confier à un bot en édition.
Par exemple :
- J'ai remarqué que mon modèle {{fi-décl}} était utilisé ailleurs que pour le finnois, est-ce que je peux avoir une liste ?
- Est-ce que je peux avoir une liste des pages où il y a une traduction en arabe sans romanisation ?
- Je veux travailler sur l'espagnol. Est-ce qu'il y a beaucoup de liens de la forme mot qui apparaissent bleus alors qu'il n'y a pas de section en espagnol sur la page ?
Suggestions :
- Repérer les lignes de définition absentes
- Repérer les modèles spécifiques à certaines langues mais utilisés dans des sections de langue différente
- Repérer les modèle {{i}} et {{t}} qui sont utilisés pour une langue autre que le français et qui ne disposent pas de paramètres pour indiquer le code de langue ce qui fait qu'ils sont rangés dans une mauvaise catégorie (voir par exemple avoid qui était catégorisé comme verbe transitif en FRANCAIS !) (mais une bonne solution est de supprimer cette catégorisation, et ce paramètre de langue Lmaltier 21 mai 2009 à 10:48 (UTC))
- Repérer les pages sans section étymologie comme oiseau sans tête
- Repérer les modèles de domaine d'utilisation/{{term}} utilisés ailleurs que dans les lignes de définition, pour pourvoir neutraliser la catégorisation dans les lexiques dans ces cas
- Repérer les modèles de domaine d'utilisation sans code langue, et créer des listes séparées par langue si l'ajout du code doit se faire à la main....moins décourageant d'avoir des listes plus petites
Repérer les {{term}}, en fonction de l'argument, pour pouvoir les trier par fréquence d'apparition, afin de pouvoir établir une liste de ceux qui pourraient par la suite être transformée en modèles de domaine d'utilisation catégorisants.Fait, voir Utilisateur:Koxinga/Arguments du modèle term et aussi ici pour un début de correspondance entre {{term}} et modèles catégorisants, là pour une ébauche de liste des doublons dans les {{term}} et encore Termes liés pour une ébauche de regroupement.- Repérer dans les sections traduction des ligne du style
* {{T|id}} : {{trad-|id|anak}} {{trad-|id|judul}}et qui devrait, en fait, ressembler à* {{T|id}} : {{trad-|id|anak judul}}, en particulier pour{{id}}et{{ms}} - Ajouter une {{clé de tri}} à toutes les pages qui commence par une majuscule. Je vérifie assez souvent la Catégorie:français et celle de l'allemand aussi pour les ajouter à main, mais ce n'est pas idéal. Pour les mots avec des diacritiques, pas aussi simple. Mglovesfun 17 avril 2009 à 13:38 (UTC)
- Ajouter lang=fr (en, it, de, es, pt, ru, etc) à toutes les pages qui utilisent le modèle {{pron}}. Mglovesfun 17 avril 2009 à 13:38 (UTC)
- Repérer les pages qui ont des caractères après la section interwiki qui normalement est la dernière partie d'un article. Quelques ajouts sans intérêt sont fait à la fin des articles donc après les liens interwiki. Relever ces articles permet de les « nettoyer ». Pamputt [Discuter] 21 mai 2009 à 10:42 (UTC)
- Une liste de toutes les redirections. Certaines sont tolérables (s'en aller) mais d'autres sont à supprimer, ou même a remplacer avec un vrai article (cf. l'historique de religieuse). Mglovesfun 21 mai 2009 à 21:53 (UTC)
- Spécial:Liste des redirections, ha dsl lol. Mglovesfun 21 mai 2009 à 21:55 (UTC)