Discussion Wiktionnaire:Listes de fréquence

Le contenu de la page n’est pas pris en charge dans d’autres langues.
Définition, traduction, prononciation, anagramme et synonyme sur le dictionnaire libre Wiktionnaire.

Bonjour,

J'ai deux questions:

  1. Y a-t-il un problème juridique quand on prend un fichier comme ceux sous [1], et qu'on en fait une page comme Wiktionnaire:Liste de fréquence/Projet Gutenberg 1-10000 ?
  2. J'ai essayé de créer une page sous ma page personnelle avec des liens vers 10000 mots allemands pris de [2], et ça a pas fonctionné (erreur » Sorry- we have a problem... The wikimedia web server didn't return any response to your request. «) Comment faut-il faire ?

Merci,--Jérôme 19 aoû 2005 à 11:53:29 (UTC)

  1. A priori, il y a un copyright sur une liste de mots, car il y a eu un travail derrière pour constituer cette liste (je dis a priori, car je n'ai pas fait d'étude en droit, alors je peux me tromper). Le plus simple, c'est de contacter les gens, normalement, je pense pas qu'ils refusent qu'on pique la liste. Mon allemand est moyen, est-ce qu'ils disent sur la page comment ils ont créé la liste (Je comprends pas "ausgewerteten Quellen") ?
  2. Pour la page que tu n'arrives pas à enregistrer, elle est peut-être trop longue. Tu peux essayer de couper par blocs de 1000. Si ça t'intéresse aussi, j'ai un script perl qui prend une liste de ce type et qui la wikifie. --Kipmaster 19 aoû 2005 à 12:06 (UTC)
Oki, bonne nouvelle, j'ai contacté les gens qui ont créé les listes, et ils sont d'accord pour l'utiliser ici en GFDL --Utilisateur:Kipmaster 11 décembre 2005 à 14:01 (UTC)[répondre]

Email reçu de ce labo :

Hi,
Am Sonntag, den 11.12.2005, 11:42 +0100 schrieb Christophe Millet (Kipmaster):
> (I'm sorry, my German is not very good, so I'll write in English,
> but you can reply in German, I'll understand).
> I'm interested in your wordlists for the 4 languages
> German, English, Nederlands and French that are here:
> http://wortschatz.uni-leipzig.de/html/wliste.html
>
> If possible, I'd like to include them in the wiki
> http://wiktionary.org/
> so that we can work on them and see which frequent words are missing.
> Before doing so, I need to know the license that applies to these lists,
> because putting them in Wiktionary means that the list would become
> GFDL there.

The top 10k lists would most likely have been put into the public domain
if that construction existed in German legislation. So it's not a
problem for us to release them to the public also under the GFDL. Go
ahead.

In addition: We have corpora in much more languages available than the
aforementioned four. And I can imagine that the wish will be well
received to release a top n word list including also the frequency in
the corpus for all of these languages (if you wish so) under the GNU
FDL. If you'd like to use this data I would ask our people in charge for
permission of release on the next meeting.

Best regards,
Matthias Richter