Aller au contenu

Discussion utilisateur:Arthurwolf~frwiktionary

Le contenu de la page n’est pas pris en charge dans d’autres langues.
Ajouter un sujet
Définition, traduction, prononciation, anagramme et synonyme sur le dictionnaire libre Wiktionnaire.
Dernier commentaire : il y a 15 ans par Koxinga dans le sujet Analyse de dump
Bienvenue !

Bienvenue sur le Wiktionnaire, Arthurwolf~frwiktionary. If you don’t speak French, click here


N’hésite pas à consulter comment modifier une page pour de premières indications sur la création et l’édition des pages du Wiktionnaire, ainsi que les conventions et la liste des modèles utilisés. Tu peux également consulter la FAQ et faire tes essais dans le bac à sable.
Pense à consulter les pages d’aide ainsi que les recommandations à suivre, la règle de neutralité, la question des droits d’auteur...

Pour signer tes messages dans les pages de discussions, tape trois fois le caractère ~. Avec un quatrième tilde s’afficheront la date et l’heure. Les articles ne sont pas signés. Nous utilisons parfois des sigles mystérieux pour communiquer entre nous : tu pourras trouver leur explication sur la page jargon.

Si tu viens d’un autre projet Wikimédia, n’oublie pas de mettre les liens vers tes autres pages perso.

Tu peux utiliser ta page personnelle pour te présenter, et demander à te faire parrainer si tu le souhaites.

Si tu as des questions à poser, n’hésite surtout pas à me contacter ou à les poser dans la Wikidémie.

Bonne continuation parmi nous !

Stéphane8888 discuter 24 décembre 2008 à 11:34 (UTC)Répondre

Formes conjuguées[modifier le wikicode]

Un peu d'histoire : il y a eu deux robots qui ont ajouté des formes conjuguées de verbes français : PiedBot, de façon un peu erratique (je n'ai pas encore compris sa logique), et LmaltierBot, effectivement, de façon beaucoup plus systématique. Mais je n'ai encore fait que les verbes du 1er et du 2e groupe, abattu n'est donc pas de moi. Lmaltier 22 décembre 2008 à 16:11 (UTC)Répondre

Je voulais juste dire que juste verbiste fait tres tres bien tous les verbes et toutes leurs formes, c'était juste pour le pointeur. C'est imaginable de l'integrer au robot ? ( il n'est vraiment pas dur à interfacer ) --Arthurwolf 22 décembre 2008 à 19:57 (UTC)Répondre

Analyse de dump[modifier le wikicode]

Si j'ai bien compris, tu te sers des dumps du wiktionnaire pour en tirer un dictionnaire. Je fais moi-même des analyses du dump pour trouver les inconsistences et les problème de mise en page. Les résultats sont disponibles ici : Koxinga/ménage. Je ne t'en parle pas pour que tu les corrige (encore que ce serait cool ;o) ) mais pour que tu fasses attention en tirant des informations automatiquement. C'est mon but à long terme que ce soit possible et fiable mais pour l'instant le wiktionnaire est encore un peu jeune, beaucoup de pages ont des problèmes.

Je ne sais pas à quel point tu vérifies les informations, peut-être que je ne t'apprend rien mais peut-être que tu peux en tirer une liste de mots suspects, à écarter ou à vérifier (par exemple les incohérences de langue, etc.). J'espère que les listes que je produis vont permettre de réduire le nombre de pages concernées assez vite, mais c'est l'affaire de quelques mois. Koxinga 25 décembre 2008 à 23:16 (UTC)Répondre

Effectivement actuellement je ne parse que 97% des mots et 90% ( approximation là vu que je ne les vois pas ) des fonctions de mots, mais c'est en partie du au fait que je dois ameliorer mes regex ...
Même chose : Je dois faire moi meme les flexions de verbe et les flexions de noms et d'adjectifs parce qu'il y a des inconsistances dans la façon dont c'est structuré, et il y a des manques.
Là je pars en deplacement, mais des que je rentre je te ferai un aperçu plus detaillé de ce que j'ai remarqué.
Globalement, je suis plutôt content, le Wiktionnaire est quand même largement assez complet pour que je puisse l'utiliser sur mon projet, et il est beaucoup plus structuré que d'autres.
Super boulot en tout cas, c'est codé en quoi, que j'adapte si j'ai des tests supplementaires à te donner ? ( et Joyeux Noel :) ) --Arthurwolf 25 décembre 2008 à 23:54 (UTC)Répondre
Je code en python. Pour l'instant je ne suis pas encore arrivé à l'analyse du contenu de la page, je ne fais que la cohérence de la structure. En plus je viens de commencer, donc je suis encore à un niveau très grossier. Il faut à la fois que j'améliore mon programme et qu'on corriger les problèmes les plus flagrants avant d'affiner. Je pense qu'on n'a pas des approches exactement identiques, là où tu veux avant tout trouver les infos intéressantes (non ?), j'essaie de parser toute la page pour la vérifier.
N'hésite pas si tu as des suggestions ou des questions (surtout si tu as des problèmes qui te gênent plus particulièrement, le wiktionnaire est fait pour être utile et je pense que cela peut motiver les éditeurs si un consommateur nous demande quelque chose ;o)). Koxinga 26 décembre 2008 à 00:07 (UTC)Répondre
Ok pour le Python. De mon coté, le programme est fait en Perl, mais les routines de parsage et de mise en coherence sont écrites en JavaScript pour que ce soit plus facilement adaptable à d'autres Wiktionnaires. Donc de JavaScript à Python, ca devrait pas être trop dur. L'analyse du contenu de la page n'est pas trop dur, SI la page est bien fichue, ce qui est le cas la plupart du temps. Il y a pas mal de choses qui pourraient être faites pour rendre l'ensemble plus facilement analysable ( en particulier coté relation entre les mots ), il faudra que je pense à noter lesquelles au fur et à mesure que le projet avance. Pour les problemes, les principaux à l'heure actuelle, ce ont les manques dans les flexions, mais je contourne en les faisant moi meme. Je ne manquerai pas de signaler quoi que ce soit d'autre qui bloque. Un exemple c'est par exemple des pages comme maladroite ou on de dit : "# Féminin singulier de maladroit." , ce serait genial une forme plus standard à parser, avec des { partout.
Mais quoi qu'il en soit, pas de blocage majeur, si ca n'est pas facile, c'est la plupart du temps possible quand meme.
Le projet sur lequel on bosse ce n'est pas vraiment un dictionnaire à proprement parler, mais un fichier de dictionnaire pour l'analyseur syntaxique link-parser ( [1] ).
Le projet commence à prendre de l'ampleur vu qu'il y a déjà des gens interressés pour le wiktionnaire portugais et lituanien. L'interret de la chose est multiple : Comprendre les phrases ( grammaticalement ) , et à plus long terme, creer la parfaite machine de traduction ( et le projet est GPL le jour ou je lui fait une page ), et à encore plus long terme, comprendre l'Internet entier avec des vues de domination mondiale ou de machine omnisciente Sourire.
En tout cas corriger les erreurs des pages va clairement dans le sens de ce que l'on recherche, et je regarde ce que je peux faire pour aider des que je rentre. --Arthurwolf 26 décembre 2008 à 00:38 (UTC)Répondre
Je t'ai répondu sur Discussion_Utilisateur:Koxinga/ménage. Koxinga 16 janvier 2009 à 23:09 (UTC)Répondre

Votre compte va être renommé[modifier le wikicode]

18 mars 2015 à 01:40 (UTC)

Compte renommé[modifier le wikicode]

21 avril 2015 à 15:56 (UTC)