« Wiktionnaire:Maintenance et nettoyage » : différence entre les versions
m →Tâches ponctuelles : màj lien |
|||
Ligne 27 : | Ligne 27 : | ||
== Tâches ponctuelles == |
== Tâches ponctuelles == |
||
* Noms féminins à transformer en lemme : [https://fr.wiktionary.org/w/index.php?title=Sp%C3%A9cial:Recherche&limit= |
* Noms féminins à transformer en lemme : [https://fr.wiktionary.org/w/index.php?title=Sp%C3%A9cial:Recherche&limit=270&offset=0&ns0=1&ns100=1&ns106=1&ns110=1&search=insource%3A%2F%27%27%27%5B%5E%27%5D%2B%28oise%7Cenne%7Caise%7Caine%7Cotte%7Celle%7Cette%7Cune%29%27%27%27%2F+incategory%3A%22Formes+de+noms+communs+en+fran%C3%A7ais%22&advancedSearch-current={{urlencode:{%22namespaces%22:[100,106,110,0]} }}] |
||
** Il s’agit de redéfinir les termes, et de changer <code><nowiki>{{S|nom|fr|flexion}}</nowiki></code> en <code><nowiki>{{S|nom|fr}}</nowiki></code> (et éventuellement mettre à jour la ligne de forme/le tableau de flexions, ainsi que la définition du féminin pluriel) |
** Il s’agit de redéfinir les termes, et de changer <code><nowiki>{{S|nom|fr|flexion}}</nowiki></code> en <code><nowiki>{{S|nom|fr}}</nowiki></code> (et éventuellement mettre à jour la ligne de forme/le tableau de flexions, ainsi que la définition du féminin pluriel) |
||
** ''' |
** '''259 pages le 18/04/2019''' |
||
** '''208 pages le 29/03/2019''' |
|||
* [[Wiktionnaire:Maintenance et nettoyage/traductions à séparer]] : Créer des boîtes pour accueillir les traductions correspondant à des sens différents. |
* [[Wiktionnaire:Maintenance et nettoyage/traductions à séparer]] : Créer des boîtes pour accueillir les traductions correspondant à des sens différents. |
Version du 18 avril 2019 à 21:04
Cette page est là pour lister les pages suspectes ou incomplètes du Wiktionnaire. Le Wiktionnaire croît très rapidement mais cela se fait parfois au détriment de la cohérence et de l’homogénéité de l’ensemble. Les contributeurs expérimentés sachant formater une page ne sont pas assez nombreux pour tout suivre et certaines pages intéressantes mais mal mises en forme passent à travers les mailles du filet. De même, certaines conventions ont changé sans que toutes les pages soient modifiées. Cette page a pour but de recenser les différents types d’erreur que l’on peut trouver automatiquement, afin de permettre à l’éditeur voulant nettoyer un peu de trouver facilement de quoi s’occuper. Certaines listes comportent des milliers de pages, mais on a le temps pour les finir et toutes les petites contributions aident. Ici vous pouvez voir :
Si vous avez un problème qui vous tient à cœur, vous pouvez aussi en parler pour voir ce qui est faisable.
|
Tâches ponctuelles
- Noms féminins à transformer en lemme : [1]
- Il s’agit de redéfinir les termes, et de changer
{{S|nom|fr|flexion}}
en{{S|nom|fr}}
(et éventuellement mettre à jour la ligne de forme/le tableau de flexions, ainsi que la définition du féminin pluriel) - 259 pages le 18/04/2019
- Il s’agit de redéfinir les termes, et de changer
- Wiktionnaire:Maintenance et nettoyage/traductions à séparer : Créer des boîtes pour accueillir les traductions correspondant à des sens différents.
- Concrètement, cela veut dire :
- Ajouter
- Concrètement, cela veut dire :
{{trad-début|Un petit résumé de la définition}} {{trad-fin}}
- autant de fois qu’il y a de sens (voir
{{trad-début}}
pour plus d’explications). - Trier selon le sens toutes les traductions que l’on connaît
- Ajouter
{{trad-trier}}
au-dessus des traductions non triées restantes - En théorie, ajouter l’argument trier au modèle
{{T}}
pour les traductions restantes à trier, mais c’est fastidieux et il vaut mieux demander à un bot de le faire.
- autant de fois qu’il y a de sens (voir
- Interwikis différents du titre de la page : /Interwikis différents du titre de la page
- Locutions sans nature grammaticale : certaines locutions comme celles de Catégorie:Locutions en français ont comme titre de section
{{S|locution}}
: à remplacer par{{S|nom}}
,{{S|adj}}
, etc., selon la nature grammaticale de la locution. Catégorie:Locutions contient toutes les catégories de locutions par langue susceptibles de contenir des pages (alors qu’elles ne devraient contenir que des sous-catégories). Voir la liste des natures grammaticales.
Catégories à vider
Les catégories sont remises automatiquement à jour donc vous êtes sûr que si un mot est là, c’est qu’il a un problème ;o)
- Catégorie:Wiktionnaire:Traductions à trier, et toutes les sous-catégories par langue
- Souvent les éditeurs qui ajoutent des traductions ne précisent pas à quel sens du mot se rapporte la définition. Il s’agit de corriger cet oubli qui diminue fortement l’intérêt des traductions. Cette catégorie contient beaucoup d’articles et ce nombre risque encore fortement augmenter si les boîtes ne sont pas automatiquement mises dans le cas où un mot a plusieurs sens. On devrait être plus rigoureux sur ce point.
- Catégorie:Verbes de type indéterminé
- Catégorie:Pages à formater
- Cette catégorie est remplie manuellement, par l’ajout du modèle
{{formater}}
sur les pages posant problème. Elle indique des pages dont le format général est à revoir.
- Cette catégorie est remplie manuellement, par l’ajout du modèle
- Catégorie:Pages à fusionner
- Les pages qui font doublons, qu’on doit réunir en une page sans perdre d’information. Peu d’articles mais souvent des modifications complexes.
- Il s’agit de marier le contenu des pages à fusionner, puis de proposer de faire une redirection d’une des deux pages vers l’autre. Lorsqu’une discussion est engagée, donner son avis permet également de faire avancer la fusion.
- Catégorie:Genres manquants
- Catégorie:Pages avec des liens de fichiers brisés
- Ces pages contiennent un lien vers un fichier qui n’existe pas. Vérifier que le nom est le bon, qu’il n’existe pas un fichier similaire qui pourrait le remplacer ou que vous ne pouvez pas créer vous-même un fichier (son, photo, …) qui pourrait convenir. Si rien de tout ça ne fonctionne, alors on peut retirer le lien en question qui n’a pas lieu d’exister.
- 371 pages le 22/01/2013.
- 315 pages le 01/11/2013.
- 231 pages le 11/12/2013.
- 88 pages le 09/05/2014.
- 46 pages le 02/05/2015.
- 42 pages le 05/10/2018.
Je n’ai mis ici que les principales catégories. Vous pouvez voir dans Catégorie:Maintenance du Wiktionnaire toutes les autres, indiquant des problèmes plus rares, moins importants ou liés à une langue.
Pages spéciales
Les pages spéciales sont maintenues automatiquement par le logiciel mais ne sont pas automatiquement à jour comme les catégories. Elles sont aussi moins adaptées à la structure du Wiktionnaire et donc parfois moins utiles.
- Pages à catégoriser.
- Il y en a quelques-unes qui pointent simplement vers un autre article, sans être une redirection. Pourquoi devrait-on les laisser comme ça ? Mglovesfun 4 avril 2009 à 11:36 (UTC)
- Je nettoie cette catégorie chaque jour, il s’agit souvent d’un essai d’un débutant, ou d’une « blague ». Mglovesfun 26 avril 2009 à 10:31 (UTC)
- Spécial:Pages orphelines
- Pages n’ayant aucun lien vers elles
- Spécial:Liste des redirections
- Certaines sont à conserver, certaines à supprimer et certaines méritent un article complet (exemple). Mglovesfun 22 mai 2009 à 14:58 (UTC)
Analyse de dump
Un dump est un fichier téléchargeable contenant l’ensemble du Wiktionnaire. Ils sont générés deux fois par mois en ce moment et disponibles sur https://dumps.wikimedia.org/frwiktionary/latest/
Koxinga a écrit un petit programme pour analyser les dumps, qu’il essaiera de faire tourner à intervalle régulier. Il a un peu jeté l’éponge, mais n’hésitez pas à lui demander si vous voulez reprendre le flambeau. Ça c’est une métaphore embrouillée !
Toute analyse de dump peut être demandée sur Wiktionnaire:Bots/Requêtes.
Nettoyage
Si vous avez nettoyé un peu, supprimez ce que vous avez fait de la liste, c’est le plus simple !
Ces sections présentent un certain nombre d’articles curieux, mais avec quelques contributeurs investis, ce nombre devrait progressivement baisser dans les mois ou années à venir.
Féminin mentionné sur la ligne de forme
Certaines entrées en français contiennent encore un féminin sur la ligne de forme, au lieu d’être en boite de flexions :
- /Féminins sur la ligne de forme
- 37 lignes le 18/07/2018
- 0 ligne le 21/10/2018
Flexion féminine à remodeler
Les entrées féminines suivantes contiennent souvent un tableau de flexions incorrect et parfois une définition incorrecte (par ex. « Féminin pluriel de <lemme masculin> » pour un nom commun, au lieu de « Pluriel de <lemme féminin> »). Souvent le lemme féminin correspondant a besoin d’être créé.
- /Formes féminines à remodeler
- 317 lignes le 02/09/2018
- 0 ligne le 08/09/2018
Tableaux de flexions erronés
Flexions qui ont un tableau de flexions {{fr-rég}}
qui indique un pluriel qui ne correspond pas au mot vedette sur la ligne de forme.
- /Tableaux de flexions erronés
- 353 lignes le 02/09/2018
- Des faux positifs ? Par exemple, le problème dans pralines, c’est où ? Renard Migrant (discussion) 6 septembre 2018 à 13:38 (UTC)
- @Renard Migrant : Je pense que c’était ça Pamputt [Discuter] 6 septembre 2018 à 14:01 (UTC)
- Pas de pblm. Renard Migrant (discussion) 6 septembre 2018 à 14:04 (UTC)
- @Renard Migrant : Je pense que c’était ça Pamputt [Discuter] 6 septembre 2018 à 14:01 (UTC)
- 247 lignes le 16/10/2018
- 0 ligne le 21/10/2018
Tableaux de flexions erronés (vrac)
Cette liste contient en vrac des flexions avec tableaux de flexions erronés (notamment quand le paramètre s= ou ms= ne correspond pas au singulier sur la ligne de définition).
- /Tableaux de flexions erronés 2
- 95 lignes le 02/09/2018
- 0 ligne le 21/10/2018
Tableaux de flexions inadaptés
Cette liste contient des tableaux {{fr-rég}}
pour des formes d’adjectifs définis comme Masculin pluriel de… ou Masculin singulier de…. Ces tableaux de flexions sont erronés car ces formes d’adjectifs sont souvent des formes d’adjectifs avec 4 formes, pour lesquelles {{fr-rég}}
ne convient pas.
- /Tableaux de flexions inadaptés
- 2225 lignes le 20/09/2018
- 0 ligne le 15/10/2018
Féminins pluriels définis comme pluriels de masculin
Formes féminines définies comme pluriel d’un lemme masculin (ex : avalantes noté comme pluriel de avalant). En date du 02/09/2018.
- /Définitions de féminins pluriels erronées
- 115 lignes le 02/09/2018
- 0 ligne le 08/09/2018
Adjectifs dénotés à tort comme épicènes
Adjectifs qui utilisent le modèle {{mf}}
sur leurs lignes de forme, bien qu’ayant des formes différentes au masculin et au féminin. En date du 1/10/2018.
- /Adjectifs dénotés à tort comme épicènes
- 120 lignes le 1/10/2018
- 0 ligne le 24/10/2018
Débuts de pages non standards
- /Débuts de page non standards
- 59 lignes le 04/10/2018
- 5 lignes le 19/10/2018
- 0 lignes le 17/03/2019
Codes langue incohérents dans étyl
- /Codes langue incohérents dans étyl
- 771 pages le 2/08/2013
Termes anciens qualifiés de néologismes
- /Termes anciens taxés de néologismes
- 54 lignes le 22/07/2018
Définitions formatées comme des exemples
Il s’agit de lignes de forme directement suivies de #*
(définition mal formatée ou exemple) au lieu de #
(définition).
- /Définitions formatées comme des exemples
- 0 ligne le 22/10/2018
Doublon de section H3
- Wiktionnaire:Maintenance_et_nettoyage/doublon de section H3
- Il s’agit des sections en double (genre deux fois
{{S|nom|fr}}
, au lieu de{{S|nom|fr|num=1}}
et{{S|nom|fr|num=2}}
. Il faut soit en enlever une (si non pertinente), soit les numéroter avec le paramètre num (voir modèle{{S}}
). - Il est possible de traiter semi-automatiquement la liste (avec AWB par exemple) afin d’aller plus vite.
- 1493 lignes le 27/07/2018
- 993 lignes le 31/10/2018
- 687 lignes le 3/01/2019
- Il s’agit des sections en double (genre deux fois
Doublon de section H4
- Wiktionnaire:Maintenance_et_nettoyage/doublon de section H4
- Le niveau H4, c’est le niveau des traductions, synonymes, dérivés, etc. Il peut s’agir d’un titre à corriger, ou de contenu à regrouper sous le même titre.
- 784 lignes le 27/07/2018
- 0 ligne le 13/08/2018
- Le niveau H4, c’est le niveau des traductions, synonymes, dérivés, etc. Il peut s’agir d’un titre à corriger, ou de contenu à regrouper sous le même titre.
Bandeaux de langue manquants
Appels de modèles inexistants
Encore quelques faux positifs, mais une grande majorité de problème réels. J’ai enlevé les appels aux variables mediawiki (PAGENAME, etc.) mais j’ai laissé les appels aux fonctions d’analyseur syntaxique (#if, etc.) qui n’ont rien à faire dans l’espace principal.
- Wiktionnaire:Maintenance et nettoyage/modèles inexistants
- 2 lignes le 27/07/2018 (des usages de #if dans des annexes qui sont incluses dans d’autres annexes : éventuellement acceptable)
Pages avec des définitions finissant par (1), (2), etc.
Certaines pages ont des définitions qui finissent par un numéro entre parenthèses faisant référence à un numéro d’ordre de définition. Ce numéro peut faire référence à une définition qui est dans la même page, ou dans une page différente. Il faudrait réécrire ces définitions pour que leur sens soit clair, et retirer ces numéros entre parenthèses.
- Wiktionnaire:Maintenance et nettoyage/Numéros_dans_définitions
- 136 pages le 27/07/2018
- 0 page le 5/03/2019
Pages mal structurées
Un nouveau test, qui révèle beaucoup de pages, en regardant quelles sections sont dans quelles sections. Dites-moi s’il y a des pages correctes détectées, j’affinerai pour la prochaine fois.
- Wiktionnaire:Maintenance_et_nettoyage/Problème de structure
- 2028 lignes le 20/04/09, dont 1489 qui concernent la section pron, qui sont moins gênantes et ne sont pas affichées ici. Cela laisse donc 539 pages dans l’immédiat.
Section H3 en dehors d’une section de langue
Souvent parce que la section de langue a été oubliée ou mal faite. Peut peut-être faire doublon avec d’autres listes.
- Wiktionnaire:Maintenance_et_nettoyage/Section H3 sans section de langue
- 123 lignes, mais les premières sont sur les unités de mesure, ce qui est un autre problème.
- 27 le 14 septembre 2009 à 18:44 (UTC), surtout les transcriptions (qu’on propose à la suppression). Mglovesfun (disc.) 14 septembre 2009 à 18:44 (UTC)
- 6 le 25 septembre 2009 à 10:11 (UTC) Mglovesfun (disc.)
- 0 le 01/11/2013
Traductions d’un mot en langue étrangère
Liste des pages comportant un modèle trad, trad- ou trad+ dans une section de langue étrangère.
- Wiktionnaire:Maintenance_et_nettoyage/Modèle trad en section étrangère
- 1259 lignes au 24/09/09
Problèmes divers
Voici enfin une liste contenant des problèmes peu fréquents, un pot-pourri de tout ce que le wiktionnaire a de pire en matière de formatage . Sûrement des problèmes d’importance très variable et de bons articles sélectionnés par erreur, n’hésitez pas à commenter le résultat.
1103 lignes le 20/04/09- 750 lignes le 07/05/09
- 623 lignes le 25/09/2009
Redirections
Le robot (« bot ») DaftBot (d · c · b) a créé des milliers de redirections pour des flexions (surtout les pluriels et les féminins singuliers) entre 2004 et 2005. Il serait préférable de les « recréer » avec les modèles comme {{-flex-nom-}}
et {{-flex-adj-}}
. Une liste de toutes les redirections (limitée à 5000 lignes) se trouve se Spécial:Liste des redirections.
- Liste vide (Utilisateur:Daahbot/Listes/Redirects à rénover ne contient plus que des redirections pour le caractère « œ », tolérables)
Le Wiktionnaire anglais
Ne soyons pas sectaire, le wiktionnaire anglais a besoin d’aide aussi. Robert Ullmann fait aussi des analyses de dump et il a compilé une liste de pluriels, féminins, formes conjuguées en français dont le mot de base n’a pas de section française. Beaucoup sont des erreurs (coquilles) créées automatiquement.
Là-bas, {{supp}}
est {{delete}}
pour les cas évidents, {{rfd}}
quand cela mérite discussion.
- en:User:Robert Ullmann/Missing forms/French
- 42 pages le 26/12/08
- 0 page le 27/11/2009
Propositions d’analyse
L’analyse des dumps est un outil très puissant, encore plus si le Wiktionnaire est bien rangé. Une fois que les problèmes les plus flagrants auront été réglés ou réduits, on peut préciser l’analyse, par exemple spécialiser par langue. Si vous trouver un problème particulier, n’hésitez-pas à en parler. Beaucoup de choses sont possibles, d’autant que l’analyse se fait par simple lecture du dump, et le site n’étant pas modifié par une telle analyse, une erreur d’analyse ne causera pas de problème. On peut essayer des choses que l’on n’oserait pas confier à un bot en édition.
Par exemple :
- J’ai remarqué que le modèle
{{fi-décl}}
était utilisé ailleurs que pour le finnois, est-ce que je peux avoir une liste ? - Est-ce que je peux avoir une liste des pages où il y a une traduction en arabe sans translittération ?
- Je veux travailler sur l’espagnol. Est-ce qu’il y a beaucoup de liens de la forme mot qui apparaissent bleus alors qu’il n’y a pas de section en espagnol sur la page ?
Suggestions :
- Repérer les lignes de définition absentes
- Repérer les modèles spécifiques à certaines langues mais utilisés dans des sections de langue différente
- Repérer les pages sans section étymologie comme oiseau sans tête
- Repérer les modèles de domaine d’utilisation/
{{term}}
utilisés ailleurs que dans les lignes de définition, pour pouvoir neutraliser la catégorisation dans les lexiques dans ces cas Repérer lesFait, voir Utilisateur:Koxinga/Arguments du modèle term et aussi ici pour un début de correspondance entre{{term}}
, en fonction de l’argument, pour pouvoir les trier par fréquence d’apparition, afin de pouvoir établir une liste de ceux qui pourraient par la suite être transformée en modèles de domaine d’utilisation catégorisants.{{term}}
et modèles catégorisants, là pour une ébauche de liste des doublons dans les{{term}}
et encore Termes liés pour une ébauche de regroupement.- Repérer dans les sections traduction des ligne du style
* {{T|id}} : {{trad-|id|anak}} {{trad-|id|judul}}
et qui devrait, en fait, ressembler à* {{T|id}} : {{trad-|id|anak judul}}
, en particulier pour{{id}}
et{{ms}}
- Ajouter lang=fr (en, it, de, es, pt, ru, etc) à toutes les pages qui utilisent le modèle
{{pron}}
. Mglovesfun 17 avril 2009 à 13:38 (UTC) - Repérer les pages qui ont des caractères après la section interwiki qui normalement est la dernière partie d’un article. Quelques ajouts sans intérêt sont fait à la fin des articles donc après les liens interwiki. Relever ces articles permet de les « nettoyer ». Pamputt [Discuter] 21 mai 2009 à 10:42 (UTC)