Анализ тональности сообщений в твиттере по различным ВУЗ'ам.
##Зависимости
- python 2.7
- scikit-learn
- numpy
- pandas
- scipy
- tweepy
- nltk
- flask
- postgresql
- matplotlib и seaborn для графиков в ноутбуках (опционально)
- gmaps плагин для jupyter notebooks опционально (https://github.com/pbugnion/gmaps)
##Инструкция
Необходимо создать файл config.ini с конфигурационными данными приложения. Файл должен иметь следующий вид:
[TwitterKeys]
access_token:
access_token_secret:
consumer_key:
consumer_secret:
[DatabaseLogin]
login:
password:
Где TwitterKeys - API ключи твиттера, а DatabaseLogin - данные для авторизации в локальной СУБД.
Монитор твитов осуществляется через веб-приложение. Для его запуска с использование virtualenv:
1) virtualenv tweet_env
2) source tweet_env/bin/activate
3) pip install -r webapp/requirements.txt
4) pip install -r webapp/conda-requirements.txt
5) python load_data.py
6) python train.py
7) cd webapp
8) python app.py
Зависимости разделены на 2 части т.к. scipy/numpy/scikit зависят от си-либ и для деплоя в heroku необходимо использовать дополнительно conda build pack. Подробнее
Текущую рабочую версию можно посмотреть тут
В случае запуска на localhost, приложение слушает 5000 порт. Открыть приложение можно перейдя на 127.0.0.1:5000
Данные для обучения взяты с сайта http://study.mokoron.com/ статья
Проект выполняется под менторством Алексея Драль (АТП ФИВТ МФТИ)