/flaskweb_reviews_predict

Определение тональности отзывов с kinopoisk

Primary LanguageJupyter Notebook

flaskweb_reviews_predict

Определение тональности отзывов с kinopoisk

Проект выполнялся в качестве задания по курсу MADE.machine_learning

Основная задача - сделать DEMO любой модели.

Была выбрана задача определения тональности отзывов с сайта kinopoisk.ru В качестве dataset использовался уже готовый, спарсенный кем-то ранее и размещенный по ссылке https://yadi.sk/d/PKs6DiPhPgjgxw

После объединения данных в один dataset (по ссылке каждый отзыв находился в отдельном файле в соответствующей папке "bad" и "good" (нейтральные отзывы для целей настоящей работы не использовались) применялось 2 модели: логистическая регрессия и классификатор RandomForest.

Результаты последнего и vectorizer были сохранены в файлы с помощью joblib.

DEMO стенд построен на flask и представляет собой форму для передачи отзыва в модель и получении результата. Для удобства отзывы случайным образом подгружаются из общего датасета (скриншоты прилагаются).

Команда проекта: Гайн Роман (gainroman@gmail.com) и Фомичев Никита (fomichev.n@gmail.com)