MADE_ml_2020_project

Чтобы запустить, необходимо, находясь в дериктории со всеми файлами, ввести streamlit run training.py Необходимые библиотеки (есть файл requirements.txt):

  1. pandas
  2. numpy
  3. sklearn
  4. annoy
  5. gensim

Описание. Сервис для подбора похожих книг по названию. Вводится название книги, в базе (main_data.csv) ищется наиболее подходящая по названию книга, по её описанию (аннотация + жанр) подбираются похожие и выводятся пользователю.

Так же реализована дополнительная функция поиска книг по жанру (просто как бонус). Выбираешь жанр, выдаются подходящие книги (отсортированные в соответствии с рейтингом).

Также я установил всё это на Heroku: Cloud Application Platform, https://obscure-wildwood-55014.herokuapp.com Поэтому я могу запустить сервер, чтобы всё опробовать.(если он не работает) Но должен работать, правда придётся немного подождать, так как первый запуск после долгого бездействия занимает время (видимо heroku заново запускает всё).

В файле Model.ipynb происходит обучение модели Word2Vec, а также вся настройка. В файле Final.ipynb класс модели. Файл Predictor.py тот же класс. Файл app.py реализация web-функций с помощью библиотеки streamlit.