Wiktionnaire:Statistiques/python/1.py

Définition, traduction, prononciation, anagramme et synonyme sur le dictionnaire libre Wiktionnaire.
# coding=utf-8
import xmlreader
import re
codelangue1="fr" # wiktionnaire
codelangue2="fr" # on s'intéresse pour l'instant au nombre de lemmes français
dump = xmlreader.XmlDump("data/"+codelangue1+"wiktionary-latest-pages-articles.xml.bz2")
nbtotal = 0
nb= 0
for entree in dump.parse():
    titre_page = entree.title
    contenu_page = entree.text
    contient = contenu_page.find("{="+codelangue2+"=}")
    nbtotal+=1
    if contient != -1:
        nb+=1
print("nombre total de lemmes du wiktionnaire = "+str(nbtotal))
print("nombre de lemmes pour "+codelangue2+" = "+str(nb))