# coding=utf-8importxmlreaderimportrecodelangue1="fr"# wiktionnairecodelangue2="fr"# on s'intéresse pour l'instant au nombre de lemmes françaisdump=xmlreader.XmlDump("data/"+codelangue1+"wiktionary-latest-pages-articles.xml.bz2")nbtotal=0nb=0forentreeindump.parse():titre_page=entree.titlecontenu_page=entree.textcontient=contenu_page.find("{="+codelangue2+"=}")nbtotal+=1ifcontient!=-1:nb+=1print("nombre total de lemmes du wiktionnaire = "+str(nbtotal))print("nombre de lemmes pour "+codelangue2+" = "+str(nb))