maifusha/docker-scrapy

Docker image for scrapy

DockerfileMIT

Docker image for Scrapy

Badages

[![build status](https://git.yoursite.com/docker/scrapy/badges/master/build.svg)](https://git.yoursite.com/docker/scrapy/commits/master)

关于本镜像

集成Scrapy==1.3.0
集成SQLAlchemy==1.1.9

爬虫项目操作

执行docker run -d -v .:/srv/crawl --name=${PWD##*/} git.yoursite.com:5005/docker/scrapy:latest启动Scrapy容器环境（容器将以当前目录为名）
爬虫项目首次启动需要初始化构建项目结构docker exec ${PWD##*/} scrapy startproject crawl /srv/crawl
执行docker exec -it ${PWD##*/} sh进入Scrapy环境（退出容器请按键CTRL + d）：

    scrapy startproject crawl /srv/crawl  #初始化爬虫项目
    scrapy genspider 【--template basic】 爬虫蜘蛛名字 爬取域名  #新建爬虫蜘蛛
    scrapy shell --nolog 爬取地址  #进入ScrapyShell进行调试
    scrapy crawl 爬虫蜘蛛名字  #启动爬虫蜘蛛开始爬取

执行docker logs ${PWD##*/}实时监控爬虫抓取状态

部署

爬虫部署请在蜘蛛空闲时段发布