Первоначальный набор данных
Независимый набор для проверки
Производится открытие набора данных. Набор данных - это выступления кандидатов на дебатах, на выборах президента США 2016. 89 кандидатов 13 500 текстов. Далее текст векторизуется и анализируется с помощью косинусной меры
Производится открытие набора данных. Переводится в векторное пространство с помощью Doc2Vec. Выполнятеся логистическая регрессия с выводов в виде confusion matrix
Производится разложение на МГК. Сначала после викторизации мешком слов, затем после векторизации Тф Идф. Строится 3-Д график и обычная плоскость
Классификация с помощью нейро сети