/GoTo-2016_autumn

Primary LanguageJupyter Notebook

GoTo-2016_autumn

primary_debates_cleaned.csv

Первоначальный набор данных

ramil.csv

Независимый набор для проверки

Cos metrics Final.ipynb

Производится открытие набора данных. Набор данных - это выступления кандидатов на дебатах, на выборах президента США 2016. 89 кандидатов 13 500 текстов. Далее текст векторизуется и анализируется с помощью косинусной меры

Log_reg_final.ipynb

Производится открытие набора данных. Переводится в векторное пространство с помощью Doc2Vec. Выполнятеся логистическая регрессия с выводов в виде confusion matrix

PCA FINAL+visual.ipynb

Производится разложение на МГК. Сначала после викторизации мешком слов, затем после векторизации Тф Идф. Строится 3-Д график и обычная плоскость

ClassifierProject.ipynb

Классификация с помощью нейро сети