« Discussion utilisateur:Jona » : différence entre les versions

Le contenu de la page n’est pas pris en charge dans d’autres langues.
Définition, traduction, prononciation, anagramme et synonyme sur le dictionnaire libre Wiktionnaire.
Contenu supprimé Contenu ajouté
→‎Mots les plus demandés : nouvelle section
Ligne 58 : Ligne 58 :
: merci
: merci
: [[User:Cdang|Cdang]] 29 novembre 2007 à 14:15 (UTC)
: [[User:Cdang|Cdang]] 29 novembre 2007 à 14:15 (UTC)

== Mots les plus demandés ==

J'avais noté les étapes suivantes pour obtenir la liste des mots les plus demandés. Si tu as des questions sur certains points, n'hésite pas :

<pre>
0/ preprocesser le dump (a recuperer sur http://download.wikimedia.org/frwiktionary/latest/ , c'est le fichier frwiktionary-latest-pages-articles.xml.bz2 )
i.e. le couper pour ne garder que la partie utile
./xml_extract_ns0.pl frwiktionary-latest-pages-articles.xml > frns0

1/ faire une liste des titres
./xml_extract_title.pl frns0 > /tmp/alltitle

2/ faire une liste des liens
./xml_extract_wikilien.pl ../wiktio/frns0 > /tmp/liens

3/ tries les listes
cat /tmp/alltitle | sort | uniq > /tmp/alltitle-tri
cat /tmp/liens | sort | uniq > /tmp/liens-tri
// cat liens | sort | uniq -c > liens-compte (fait plus bas)

4/ faire la différence, ne garder que les nouveaux dans liens-tri
c'est a dire les liens qui ne sont pas des titres.
comm /tmp/alltitle-tri /tmp/liens-tri -1 -3 > /tmp/ladiff

ici : changer le tri de ladiff
msort -l -w /tmp/liens | uniq -c > /tmp/liens-compte
msort -l -w /tmp/ladiff > /tmp/ladiff2

5/ préprocesser pour avoir tout
./demander-format.pl /tmp/ladiff2 | sort -nr > /tmp/nbnb

6/ wikification
./demander-post.pl /tmp/nbnb > /tmp/nbok
</pre>

Liens vers les scripts utilisés :
* [[Utilisateur:Kipmaster/xml_extract_ns0.pl]]
* [[Utilisateur:Kipmaster/xml_extract_title.pl]]
* [[Utilisateur:Kipmaster/xml_extract_wikilien.pl]]
* [[Utilisateur:Kipmaster/demander-format.pl]]
* [[Utilisateur:Kipmaster/demander-post.pl]]

PS: si le format du dump ou qqch d'autre a changé depuis que j'ai lancé le script, il peut avoir besoin d'un peu d'adaptation.

[[Utilisateur:Kipmaster|Kipmaster]] [[Discussion_Utilisateur:Kipmaster|☯]] 7 juillet 2008 à 20:22 (UTC)

Version du 7 juillet 2008 à 20:22

Bienvenue sur le Wiktionnaire, Jona

N'hésite pas à consulter comment modifier une page pour de premières indications sur la création et l'édition des pages du Wiktionnaire, ainsi que le guide de style et la liste des modèles utilisés. Tu peux également consulter la FAQ et faire tes essais dans le bac à sable.
Pense à consulter les recommandations à suivre (règle de neutralité, copyright...).
Enfin, tu pourras trouver des réponses à tes éventuelles questions sur les pages d'aide.

Pour signer tes messages, tu peux taper trois fois le caractère ~. Avec un quatrième tilde, en plus de ta « signature », seront affichées la date et l'heure. Les articles ne sont pas signés. Nous utilisons des sigles parfois mystérieux : tu pourras trouver leur explication sur la page jargon.

Si tu viens d'un autre Wikimédia, n'oublie pas de mettre les liens vers tes autres pages perso.

Tu peux utiliser ta page personnelle pour te présenter.

Si tu as des questions à poser, n'hésite surtout de pas à me contacter, à les poser dans la Wikidémie ou à venir discuter dans notre salon IRC.

Bonne continuation parmi nous ! (et désolé pour le retard de ce message de bienvenue ;) - Dakdada (discuter) 25 sep 2005 à 11:58 (UTC)

J'ai créé l'article (que tu peux améliorer...) Lmaltier 15 juin 2006 à 20:06 (UTC)[répondre]

Conjugaison française

J'ai vu que tu avais corrigé une faute que j'avais faite sur le mot "appuyer". Je t'en remercie, car je n'avais jamais vu cette erreur. Heureusement que tu l'as vue ! Thorgal 28 juillet 2006 à 13:26 (UTC)[répondre]

Tableau

Salut, en effet, c'est une erreur de mon bot. Je vais vérifier s'il n'a pas fait la même erreur ailleurs (ou des erreurs similaires). Merci de m'avoir prévenu. - Dakdada (discuter) 21 aout 2006 à 15:22 (UTC)

Le but du mot du jour n'est pas que de rajouter des mots dans le wiktionnaire, mais aussi d'améliorer la qualité globale des articles. Quand tu changes le mot du jour essaye de vérifier s'il a déjà été mot du jour le mois précédent, et si ce n'est pas le cas vérifie que la qualité de l'article est satisfaisante. Ca fait un peu police, (c'est un peu parce que c'est moi qui avait mis le mot), ne le prends pas mal et continue à participer au wiktionnaire, merci... JR disc 1 septembre 2006 à 15:13 (UTC)[répondre]

mot du jour pour le 31 septembre

spectaculaire comme idée, on le gardera jusqu'au 31 octobre si tu n'y vois pas d'inconvénient ;-) JR disc 25 septembre 2006 à 15:52 (UTC)[répondre]

Faux-amis

Bonsoir Jona,

il y a un paquet de faux-amis dans le Wikilivre ! Crois-tu qu'il faille tous les retranscire ici ? Ça risque de doublonner, non ? - Dakdada (discuter) 19 octobre 2006 à 17:18 (UTC)[répondre]

Ça ne me pose pas de problème si tu retire « castillan ». Mais si c'est la même langue pourquoi croirait-on qu'un hispanophone est bilingue ? -moyogo/ ⁽ᵈⁱˢᶜᵘᵗᵉʳ⁾ 8 décembre 2006 à 17:35 (UTC)[répondre]

Majuscule et point final

J'vas essayer d'y penser. Mais toutes ces abréviaitons pour les modèles, je m'y perd un peu. C'est résumé sur une page d'aide ?

Cdang 23 novembre 2007 à 14:54 (UTC)[répondre]

merci
Cdang 29 novembre 2007 à 14:15 (UTC)[répondre]

Mots les plus demandés

J'avais noté les étapes suivantes pour obtenir la liste des mots les plus demandés. Si tu as des questions sur certains points, n'hésite pas :

0/ preprocesser le dump (a recuperer sur http://download.wikimedia.org/frwiktionary/latest/ , c'est le fichier frwiktionary-latest-pages-articles.xml.bz2 )
i.e. le couper pour ne garder que la partie utile
./xml_extract_ns0.pl frwiktionary-latest-pages-articles.xml > frns0

1/ faire une liste des titres
./xml_extract_title.pl frns0 > /tmp/alltitle

2/ faire une liste des liens
./xml_extract_wikilien.pl ../wiktio/frns0 > /tmp/liens

3/ tries les listes
cat /tmp/alltitle | sort | uniq > /tmp/alltitle-tri
cat /tmp/liens | sort | uniq > /tmp/liens-tri
// cat liens | sort | uniq -c > liens-compte (fait plus bas)

4/ faire la différence, ne garder que les nouveaux dans liens-tri
c'est a dire les liens qui ne sont pas des titres.
comm /tmp/alltitle-tri /tmp/liens-tri -1 -3 > /tmp/ladiff 

ici : changer le tri de ladiff
msort -l -w /tmp/liens | uniq -c > /tmp/liens-compte
msort -l -w /tmp/ladiff > /tmp/ladiff2

5/ préprocesser pour avoir tout
./demander-format.pl /tmp/ladiff2 | sort -nr > /tmp/nbnb

6/ wikification
./demander-post.pl /tmp/nbnb > /tmp/nbok

Liens vers les scripts utilisés :

PS: si le format du dump ou qqch d'autre a changé depuis que j'ai lancé le script, il peut avoir besoin d'un peu d'adaptation.

Kipmaster 7 juillet 2008 à 20:22 (UTC)[répondre]