/DouBanSpider

豆瓣信息抓取

Primary LanguagePython

1.DouBanMovie.py 豆瓣电影爬虫,抓取豆瓣电影的电影信息,包括电影名称,评分,评价人数等。

2.DouBanBook.py 豆瓣读书爬虫,抓取豆瓣读书书籍的基本信息。

ps:这两个程序需要自己填写自己数据库信息,每个分类默认抓取一页,以后会改进这两点。以后可能会抓取更多内容如热评,添加多线程和代理ip提高抓取效率,储存到execl等。