Классификатор текстовых сообщений на Scala. Используется ранее собранный датасет с "позитивными" и "негативными" сообщениями. С его помощью обучается алгоритм, построенный на теореме Баерса. На основании этой модели можно с определённой вероятностью оценить "позитивность" или "негативность" входящего текста.
Использованная литература:
- Описание алгоритма и примеры на Scala
- Рубцова Ю. Автоматическое построение и анализ корпуса коротких текстов (постов микроблогов) для задачи разработки и тренировки тонового классификатора //Инженерия знаний и технологии семантического веба. – 2012. – Т. 1. – С. 109-116.
- Данные для обучения алгоритма