Wiktionnaire:Questions techniques/mai 2017

Définition, traduction, prononciation, anagramme et synonyme sur le dictionnaire libre Wiktionnaire.
Aller à : navigation, rechercher

Page mensuelle des questions techniques posées en mai 2017. Page précédente : avril 2017Page suivante : juin 2017Modifier ce cadre



Comment supprimer homoeopathnies ?[modifier]

Au secours !

Comment demander la suppression de la redi homoeopathnies (D H L) : il s’agit d’une coquille et j’ai renommé en homoeopathies (D H L) (sans n).

Merci d’avance. Alphabeta (discussion) 7 mai 2017 à 12:27 (UTC)

fait Il fallait juste y coller {{SI}}. JackPotte ($) 7 mai 2017 à 13:22 (UTC)
Merci. On tâchera de mémoriser. Ça diffère de la Pédia où il faut effectuer une requête dans w:fr:WP:SI : j’avais cherché en vain l’équivalent dans le Wix… Alphabeta (discussion) 7 mai 2017 à 13:31 (UTC)
Cela ne diffère pas en fait, car la même procédure (avec w:Modèle:SI) fonctionne très bien sur Wikipédia. JackPotte ($) 7 mai 2017 à 14:45 (UTC)
Re-merci : j’ignorais pour WP… Alphabeta (discussion) 7 mai 2017 à 15:34 (UTC)

Faire des rimes un truc puissant[modifier]

Bonjour cher collègues doués (en informatique par rapport à moi). Mon grand délire actuellement, c'est les rimes. Or voilà, je perds un temps fou à faire des tris… Ce qui est dommage pour un ex-dév comme moi… Prenant mon courage à deux main, je me suis mis en place un protocole de fonctionnement à moitié manuel (parce que tout automatiser ce serait l’emballement…) afin de générer « rapidement » des pages de rimes de bonne qualité. Voici donc comment je compte faire :

  1. Générer une liste de rimes la plus compète possible à partir de REGEX sur le titre, sous cette forme là :
    • * [[mot]] {{pron|mɔ|fr}} à chaque ligne, si pas de prononciation, mettre le modèle vide.
  2. Éliminer les prononciations finale ne correspondant pas à la rime :
    • Par exemple fake ne rime pas en \ak\, et doit donc être éliminé de cette liste.
  3. Remplir toutes les prononciations vides dans les articles. Oui, je sais, c’est long, mais beaucoup plus pérenne.
  4. Regénérer la liste avec toutes les prononciations complètes.
  5. Trier la liste par les prononciations en partant de la fin.
  6. Mettre en forme la liste en la sous-sectionnant.
  7. Trier les sous-sections en rimes féminines et masculines.
  8. Mettre à jour la page.

Ouais… C’est long… Et tout ne peut pas être automatisé sans grandes peines. Mais j'aimerais automatiser les étapes :

  • 1 : faut juste que j'arrive à extraire la prononciation de l’article en même temps que je génère ma liste.
  • 4 : Je vois pas trop comment procéder…
  • 5 : Ça c’est important à faire ! C’est ultra-long à faire à la main.

Tout le reste peut être fait à la main avec une temps nécessaire de vérifications et de contributions. Bon évidemment, c’est une première idée de fonctionnement, si vous avez une meilleure idée, un outil plus performant, ou que sais-je de plus, c’est l’occasion d’en discuter. Perso, je suis pas très fan de ms 4 premières étapes. Évidemment l’idéal serait de n’avoir qu’à remplir les prononciations dans les articles et tous les mois (voire « en direct !! ») les listes de rimes se mettraient à jour. Mais en attendant, je n’ai que ça à proposer. --— Lyokoï (Discutons Mort de rire) 10 mai 2017 à 12:59 (UTC)

Pour aider : j'ai dans l'outil de recherche une option permettant de distinguer les articles n'ayant pas de prononciation, ce qui permet par exemple de chercher les mots finissant par "ak" dont il faut compléter la prononciation. Une fois les articles (et la base de données de l'outil) mis à jour, on peut en extraire les rimes, en cherchant par prononciation (en \*ak\), et ce ordonné dans l'ordre inverse (point 5). Il y a quelques améliorations qui pourraient t'aider encore : 1) permettre d'afficher la liste dans un format wikitexte à copier-coller, 2) mettre à jour la base quotidiennement, 3) ajouter des sections automatiques. Le point 1 ne devrait pas être trop long à faire. Pour le point 2, c'est quelque chose de très important sur quoi je travaille en ce moment. — Dakdada 10 mai 2017 à 13:23 (UTC)
Génial ! Je ne savais pas qu'on pouvait faire le tri inverse en cherchant par la fin.
  • Y’a-t-il un moyen de faire correspondre le tri avec l’ordre qui a été voté : ʔ a ɑ ɑ̃ e ɛ ə ø œ i ɛ̃ œ̃ o ɔ ɔ̃ u y — j w ɥ — b k ʃ d f ɡ ʒ l m n ɲ (=gn) ŋ (=ng) p ʁ s t v z ?
Ouais, faire un format wikitexte à copier-coller est l’option qui me fait toujours utiliser l’ancien module pour les anagrammes. Si le point 1 peut être fait rapidement, cela pourrait permettre l’usage des listes générées par l’outil. Pour l’ajout de section automatique, on a pas encore établit de règle dessus, donc c’est un peu complexe de le faire maintenant. Par contre la mise à jour quotidienne, si tu y arrives bravo ! Mais déjà avec une mensuelle, ça peut être top.
Sinon, j'ai quelques questions :
  • y'a-t-il une limite à la liste de mots à l’affichage (certaines rimes font plus de 30 000 entrées) ?
  • Est-il envisageable de faire des recherches par REGEX (en graphie en tout cas, mais pourquoi pas en prononciation…) ?
Bon en tout cas, j'ai au minimum 297 082 Prononciations manquantes en français… Sans compter les pages sans {{pron||fr}} en ligne de forme… Ça va être du boulot ! Mort de rire --— Lyokoï (Discutons Mort de rire) 11 mai 2017 à 13:59 (UTC)
Pour le tri, ce n'est pas possible pour le moment : j'affiche la liste dans l'ordre de la requête mysql, et c'est donc l'ordre des caractères Mysql qui est utilisé. La solution serait de refaire un tri côté client (donc avec un bouton quelque part), mais ce n'est pas aussi simple à gérer.
J'ai ajouté l'option pour afficher du wikitexte (il va peut-être falloir attendre un peu que le cache se renouvelle), ça a l'air de marcher convenablement ;)
Il n'y a pas de limite réelle aux requêtes, si ce n'est que la recherche nécessite au moins 2 caractères (tu ne peux pas chercher *a par exemple), SAUF si c'est une recherche avec "prononciation" manquant auquel cas une lettre suffit. Si la liste de rimes est vraiment longue, alors la page sera juste plus longue à générer et charger...
Il n'y a pas de régex (ce serait trop gourmand), mais on peut utiliser les 2 jokers * et . Si tu veux absolument une recherche par regex, il faut que tu fasses une recherche sur la base de données directement.
La mise à jour quotidienne est pour l'instant un projet loin d'être réalisable. Par contre je dois pouvoir sortir une version mensuelle (à chaque nouveau dump général). — Dakdada 11 mai 2017 à 15:24 (UTC)
Pas aussi simple ? Bon, au moins les informations sont rangée par section, suffis de les remettre dans l’ordre par paquet, c’est déjà ça.
Super pour l’ajout ! Clin d’œil
D’accord, super !
Oki, pour les REGEX => AWB ! :D
Déjà mensuelle, ce serait vraiment cool, mais tu faisais comment jusque là ? --— Lyokoï (Discutons Mort de rire) 11 mai 2017 à 17:40 (UTC)
À la main, donc quand j'ai le temps ><. — Dakdada 12 mai 2017 à 08:28 (UTC)
Fichtre ! En effet, c’est plus mieux de le faire automatiquement, même une fois par mois. C’était pas le cas sur l’outil dans le tool labs ? --— Lyokoï (Discutons Mort de rire) 12 mai 2017 à 12:46 (UTC)

Recherche par langue[modifier]

Bonjour,

Je fais régulièrement des recherches étymologiques dans wiktionnaire. Il est malheureusement assez fréquent dans les étymologies qu’il n’y ait pas de lien d'un article à un autre ce qui m’oblige régulièrement à faire des recherches textuelles pour savoir si un mot fait référence ou non à un étymon… bref là n’est pas la question (et oui, je rajoute les liens quand j’en trouve en utilisant notamment le modèle idoine).

Ma question concerne surtout la recherche avancée. Est-il possible de limiter la recherche aux articles relatifs à une langue donnée (le français en l’occurrence) ?

Par exemple, quand je cherche le suffixe "-esce" de l’ancien français dans le wiktionnaire, je vois remonter une quantité impressionnante de mots bulgares (j’ignore comment la correspondance se fait au juste vu que dans les articles que j’ai consultés sur le bulgare je n’ai pas trouvé la suite de caractère "esce"). Il me serait donc pratique de pouvoir dire que je cherche "-esce" dans les mots français et pas ailleurs.

Est-ce possible ?

Jpgibert (discussion) 12 mai 2017 à 09:57 (UTC)

Bonjour, si la question est de ne chercher que dans le titre d'article (et pas dans le texte des articles), alors WT:Recherche avancée peut servir à cela : il suffit d'y chercher "*esce" et de sélectionner l'ancien français comme langue. — Dakdada 12 mai 2017 à 11:37 (UTC)
Et malheureusement non, le titre ne suffit pas je cherche généralement dans la partie étymologie des articles. Cela dit, je ne connaissais pas cette recherche (que je n’ai pas été fichu de retrouver par moi-même d’ailleurs… - quand je clique sur Recherche avancée, je vois juste se dérouler un bandeau avec plein de cases à cocher mais ça ne correspond pas à ce que je cherche). Jpgibert (discussion) 12 mai 2017 à 12:22 (UTC)
Je te conseille d'utiliser le Database Scanner dans les tools d'AWB. L'usage est simple et tu peux faire des recherches croisées titre et corps de l'article. Si tu connais un peu les REGEX (c'est pas trop complexe) tu peux vraiment te faire plaisir. Perso, je l'utilise souvent donc si tu as une question, je peux t'aider. — Lyokoï (Discutons Mort de rire) 12 mai 2017 à 12:48 (UTC)
J'ai plus "simple" en fait : dans ce cas il faut recourir à des mots clés plus avancés. Dans le Wiktionnaire toute langue a une catégorie à soi donc il suffit de s'y restreindre avec le mot clé incategory. Exemple : incategory:français *esce, ou encore -incategory:bulgare *esce. Plus de détails dans mw:Help:CirrusSearch/fr. — Dakdada 12 mai 2017 à 12:52 (UTC)
Quand on clique sur le lien ci-dessus pour le bulgare, on trouve plein de mots qui ne sont pas dans la catégorie bulgare. T a-t-il une explication ? Lmaltier (discussion) 19 mai 2017 à 16:35 (UTC)
Pardon, je n'ai pas précisé que le second lien exclut le bulgare avec le signe - devant incategory. — Dakdada 19 mai 2017 à 18:53 (UTC)
Ah, merci. Si on enlève le -, on ne trouve rien. Alors, comment se fait-il qu’il y ait plein de mots bulgares dans la recherche normale. Je n’ai pas encore réussi à comprendre. Lmaltier (discussion) 19 mai 2017 à 19:13 (UTC)
Parce que la recherche demandée initialement avec "-esce" est aussi négative Mort de rire. Je l'avais pas compris jusque là... — Dakdada 20 mai 2017 à 09:48 (UTC)
Merci pour toutes ces infos, je me pencherai dessus prochainement. Jpgibert (discussion) 12 mai 2017 à 13:11 (UTC)

Sections de niveau 3[modifier]

Salut,

Quelque chose a changé ? : depuis 2 jours les boites, dans une section donnée, empiètent sur la section de niveau 3 suivante. De mémoire, je ne pense pas que ça le faisait auparavant, où cela se comportait comme si il y avait un {{Clr}} avant chaque section de niveau 3. Voir par exemple girkolaš. — Unsui Discuter 12 mai 2017 à 19:50 (UTC)

Mea culpa, je comprends maintenant à quel point cela peut prêter à confusion, et je vais donc remettre un clear. JackPotte ($)
fait JackPotte ($) 12 mai 2017 à 22:01 (UTC)
Pas de problème. Merci bien. — Unsui Discuter 13 mai 2017 à 08:27 (UTC)

Modèle:lien pronominal[modifier]

Bonjour, le modèle {{lien pronominal}} est principalement (uniquement ?) utilisé en français. Mais la documentation indique que le paramètre peut prendre un paramètre de langue pour catégoriser dans « Catégorie:Verbes pronominaux en XXX ». Cela dit en pratique ça ne semble pas servir à grand chose étant donné que le modèle ajout uniquement « se » devant le verbe (ou « s’ » en cas d’élision). Ça ne correspond pas du tout à d’autres langues. Par exemple, en espagnol il faut rajouter « se » à la fin du verbe (par exemple erigirse pour erigir). Ca serait donc intéressant de faire évoluer ce modèle pour qu’il puisse prendre en compte les spécificités de chaque langue. Mais je ne sais pas comment faire cela de manière élégante. Une idée ? Pamputt [Discuter] 19 mai 2017 à 13:34 (UTC)

Faire un module serait le plus sage. On pourrait alors appliquer diverses règles suivant les langues tout en restant lisible. Un module pourrait aussi utiliser des fonctionnalités avancées comme la détection d'élision, rendant l'utilisation du paramètre ' obsolète pour quasiment tous les mots (sauf les cas spéciaux). — Dakdada 19 mai 2017 à 15:03 (UTC)
Ouais, moi aussi je vote pour que Pamputt développe son module Lua Sourire. JackPotte ($) 19 mai 2017 à 16:02 (UTC)

Barres d'outils disparues[modifier]

Sous Chrome, tous les outils d’édition ont disparu, je n’ai même plus le bouton pour mettre la signature ici, je suis obligé de taper --~~~~ à la main, et ce n’est qu’un exemple (plus embêtant, je n’ai plus les caractères API) --Ars’ 22 mai 2017 à 18:23 (UTC)

Sous FF53, tut‿ɛ ɔkɛ--Ars’ 22 mai 2017 à 18:29 (UTC)
De quelle barre d'outils parles-tu exactement ? Les outils sous la zone de texte ? La barre d'outils "améliorée" au dessus de la zone de texte ? Ou l'ancienne barre d'outils ? — Dakdada 23 mai 2017 à 09:34 (UTC)
Ça devrait être réparé suite aux modifications de Nemo Bis. J’avais un problème similaire — javascript personnel qui ne fonctionne pas —, apparemment dû à un javascript qui plante tout le reste, en effet. Ça semble corrigé, en tout cas. — Automatik (discussion) 24 mai 2017 à 00:57 (UTC)