Использование алгоритмов кластеризации для выявления скрытых тем в корпусе сообщений твиттера
В репозитории представлены только скрипты для препроцессинга текстовых данных (а также получения их из базы) (Python 3.5) и скрипты для кластеризации обработанных данных и споследующей визуализации (R). Конфигурационные файлы Томита-парсера в репозитории не присутствуют.