Драчев, Торбин, Фильчагин, Аншаков
- Requests
- BeautifulSoup
- django
- mongodb
- pyspark
- threading
- остальное в процессе будет добавляться
По пути ./config/config.txt есть конфигурационный файл. В нем прописаны настройки базы данных mongodb.
- db_name - название базы данных
- collection - название коллекции
- host - название хоста (например: localhost, www.exemple.com)
- port - номер порта (по умолчанию в mongodb: 27017)
Запуск программного кода в ОС Linux Ubuntu Необходимо перед началом настройки проекта, настроить базу данных mongodb. После настройки скачать проект:
- git clone https://github.com/lolMatrix/news_and_attraction.git
- cd news_and_attraction
- sudo apt update
- sudo apt install python3 -y && sudo apt install python3-pip -y
- sudo apt install --assume-yes p7zip-full -y
- 7z x tomitaworker/tomita/tomita-parser.7z
- mv tomita-parser tomitaworker/tomita
- chmod +x tomitaworker/tomita/tomita-parser
- pip3 install virtualenv
- python3 -m virtualenv venv
- source venv/bin/activate
- pip install -r requirements.txt
- python main.py
Сервер django автоматически запускается вместе с краулером