Este repositório contém os textos de entrada e saída da ferramenta de teste utilizando a biblioteca implementada no TCC2.
A pasta input contém os arquivos com os textos extraídos da Wikipedia. A pasta output-com-lematizador contém os textos anotados utilizando o algorítmo de lematização. A pasta output-sem-lematizador contém os textos anotados sem a utilização do algorítmo de lematização.
Os arquivos utilizados foram extraídos da Wikipedia e podem estar sob as seguintes licenças: