Определение тональности отзывов с kinopoisk
Проект выполнялся в качестве задания по курсу MADE.machine_learning
Основная задача - сделать DEMO любой модели.
Была выбрана задача определения тональности отзывов с сайта kinopoisk.ru В качестве dataset использовался уже готовый, спарсенный кем-то ранее и размещенный по ссылке https://yadi.sk/d/PKs6DiPhPgjgxw
После объединения данных в один dataset (по ссылке каждый отзыв находился в отдельном файле в соответствующей папке "bad" и "good" (нейтральные отзывы для целей настоящей работы не использовались) применялось 2 модели: логистическая регрессия и классификатор RandomForest.
Результаты последнего и vectorizer были сохранены в файлы с помощью joblib.
DEMO стенд построен на flask и представляет собой форму для передачи отзыва в модель и получении результата. Для удобства отзывы случайным образом подгружаются из общего датасета (скриншоты прилагаются).
Команда проекта: Гайн Роман (gainroman@gmail.com) и Фомичев Никита (fomichev.n@gmail.com)