Utilisateur:JackBot/Hyperlynx.py
Définition, traduction, prononciation, anagramme et synonyme sur le dictionnaire libre Wiktionnaire.
#!/usr/bin/env python # Ce script supprime les URL hors service depuis plus d'une semaine. # Déclaration language = "fr" family = "wiktionary" mynick = "JackBot" # Importation des modules import os from wikipedia import * site = getSite(language,family) # Lecture du fichier de sortie de weblinkchecker.py (attention : il trafique les noms de pages avec accent) def lecture(source): HyperLynx = open(source, 'r') while 1: txt = HyperLynx.readline(2) if txt =='': break elif txt == '* ': URLHS = HyperLynx.readline() elif txt == '**': PageHS = HyperLynx.readline() debut = PageHS.find("[[") fin = PageHS.find("]]") PageHS = PageHS[debut + 2:fin] modification(URLHS, PageHS) HyperLynx.close() HS = [URLHS, PageHS] return HS # Modification du wiki def modification(URLHS, PageHS): page = Page(site,PageHS) PageTemp = page.get() PageEnd = "" position = 0 while position < len(PageTemp): position = PageTemp.find("http") if position < 0: break else: PageEnd = PageEnd + PageTemp[0:position] PageTemp = PageTemp[position:len(PageTemp)] position = PageTemp.find(" ") URL = PageTemp[0:position] if URL+"\n" != URLHS: PageEnd = PageEnd + PageTemp[0:position] PageTemp = PageTemp[position:len(PageTemp)] PageEnd = PageEnd + PageTemp[0:len(PageTemp)] #print(PageEnd) page.put(PageEnd, "Retrait d'URL HS") # Lancement HS = lecture('./deadlinks/results-wiktionary-fr.txt') #print HS raw_input("Jackpot") # Reset du fichier des URL HS fichier = open('./deadlinks/results-wiktionary-fr.txt', 'w') fichier.write('') fichier.close()