scrapy-moscow-organizations: A Python repository from denisorehovsky

Description

Get data about Moscow organizations from http://rubrikator.org/russia/moscow by scraping pages.

Pull the splash docker image:

$ sudo docker pull scrapinghub/splash

Start the container:

$ docker run -p 8050:8050 scrapinghub/splash

Install dependencies after configuring your virtualenv:

$ pip install -r requirements.txt

Start crawling:

$ scrapy crawl organizations

By default, all data will be saved inside output folder. One file for each organization.