/python_spider

一些小的爬虫程序

Primary LanguagePython

weixin_gzh

weixin_gzh
    抓取指定微信公众号历史文章

html_to_pdf
    将网页截屏,转换成 pdf 文件

scrapylearn

Scrapy 爬虫框架学习记录

helloworld
    Scrapy helloworld 项目
    运行命令:scrapy crawl hello_world

douban
    抓取豆瓣电影top250信息
    运行命令:scrapy crawl douban -o movies.csv