/Spider

一些爬虫项目

Primary LanguageHTMLMIT LicenseMIT

Spider

一些爬虫脚本

脚本目录:

脚本编号 脚本名称 链接 是否完成
01 获取A股所有上市公司财报 链接
02 获取CSDN首页新闻 链接
03 获取携程网机票信息 链接
04 从豆瓣上获取所有出版商名称 链接
05 从百度文库上按照某作者名称获取其下所有文档名称及链接 链接
06 获取“笨鸟先飞”公众号提供的百度网盘链接 链接
07 从杭电官网获取杭电计算机学院所有导师的公开信息 链接
08 从江大官网获取江大计算机学院所有导师的公开信息 链接
09 在传智播客上学习Scrapy爬虫时的听课案例 链接
10 从游侠网上获取某个游戏的下载链接(练习Xpath的应用) 链接
11 从阳光电影网站获取电影信息并写入数据库供网站使用 链接
12 获取浙江烟草公司指定时期内公告(部分为隐藏公告) 链接