一些爬虫脚本
脚本编号 | 脚本名称 | 链接 | 是否完成 |
---|---|---|---|
01 | 获取A股所有上市公司财报 | 链接 | 是 |
02 | 获取CSDN首页新闻 | 链接 | 是 |
03 | 获取携程网机票信息 | 链接 | 是 |
04 | 从豆瓣上获取所有出版商名称 | 链接 | 是 |
05 | 从百度文库上按照某作者名称获取其下所有文档名称及链接 | 链接 | 是 |
06 | 获取“笨鸟先飞”公众号提供的百度网盘链接 | 链接 | 是 |
07 | 从杭电官网获取杭电计算机学院所有导师的公开信息 | 链接 | 否 |
08 | 从江大官网获取江大计算机学院所有导师的公开信息 | 链接 | 否 |
09 | 在传智播客上学习Scrapy爬虫时的听课案例 | 链接 | 是 |
10 | 从游侠网上获取某个游戏的下载链接(练习Xpath的应用) | 链接 | 是 |
11 | 从阳光电影网站获取电影信息并写入数据库供网站使用 | 链接 | 是 |
12 | 获取浙江烟草公司指定时期内公告(部分为隐藏公告) | 链接 | 是 |