/MinerRegExBot

Bot basé sur les expressions régulières générant des entrées pour wikipast.epfl.ch

Primary LanguagePython

MinerRegExBot

Bot basé sur les expressions régulières générant des entrées pour wikipast.epfl.ch. Le MinerRegExBot utilise un texte afin d'y trouver des informations concernant un genre d'évènement qui s'est produit, d'en extraire l'essentiel, par exemple la date ou le lieu et de le publier sous une forme prédéfinie sur le wiki. Pour ce faire, le MinerRegExBot procède en deux étapes. Premièrement, il prend un texte déjà téléchargé et le passe en revue afin d'identifier chaque suite de mots correspondant à l'expression régulière du type d'évènement souhaité. Ensuite, il prend chaque résultat de l'étape précédente et procède à un tri. Il enlève certains mots pouvant être mal interprétés par le bot lorsqu'il tentera de choisir les informations essentielles. Par exemple, M. ou encore Mme qui pourraient être analysés comme des noms. Finalement, le MinerRegExBot utilise ce qu'il reste afin d'extraire les éléments qui vont pouvoir former la publication sous une forme prédéfinie sur Wikipast.