/news_classification

Primary LanguageJavaApache License 2.0Apache-2.0

news_classification

El presente proyecto entrena y crea un clasificador de noticias extraídas del períodico ¡ahora! (http://www.ahora.cu/es/).

Las noticias son preprocesadas con algoritmos de Lucene. Se realizó un estudio experimental con algoritmos de clasificación de texto de LingPipe. Esto se encuntra en la clase ProcesarNoticias. La clase clasificacion.ClasificarNoticias entrena y crea el clasificador luego de preprocesar con el algoritmo Dynamic Language Model que fue el que obtuvo mejores resultados en el estudio experimental.

Este proyecto es parte de la tesis SISTEMA DE CLASIFICACIÓN AUTOMÁTICA DE NOTICIAS A PUBLICAR EN EL PERIÓDICO ¡AHORA! DIGITAL (2010), donde se explica el diseño experimental y los resultados: https://www.researchgate.net/project/Clasificacion-de-noticias