Требования:
- docker
- docker-compose
- conda
Конда
conda env create -f environment.yml
Докер
ssh-keygen
cp $HOME/.ssh/id_rsa.pub tomita/
sudo docker-compose build
NLTK
python -m nltk.downloader punkt wordnet averaged_perceptron_tagger stopwords
sudo docker-compose up
Парсит сайт и сохраняет новости в БД в коллекцию "news".
python src/news_parser.py
Выделение предложений и новостей, в которых есть упоминания персон и достопримечательностей Волгоградской области с помощью Томита-парсера
python src/tomita.py
Запуск в консольном интерактивном режиме. При первом запуске будет построена модель word2vec. Также этото скрипт может использоваться как модуль из других скриптов.
python src/synonyms.py -i
Обучение модели.
python src/sentiment.py -t
Использование в интерактивном консольном режиме. Также этото скрипт может использоваться как модуль из других скриптов.
python src/sentiment.py -p
python src/index.py