/Crawler

b站学习Python网络爬虫后自己写的练习代码,分别可以爬取某些歌曲的评论,以及爬取某些新闻的内容(以上爬取内容均遵循网页的robots.txt规则)

Primary LanguagePython

根目录

main.py -- 用于爬取网易云音乐歌曲热评 douban.py -- 用于爬取豆瓣Top250电影评分榜上的电影信息 news.py -- 用于爬取搜狐财经的实时热点新闻,并将新闻内容写入word文档

ReferCode

excel_op.py -- 用于对Excel文件进行读写操作,亦或是将爬取到的评论内容写入Excel文件 xlwt和xlrd的操作对象都是xls类型文件,它是Excel 2003版本的低版本文件跟新版的xlsx文件不同

wangyiyun_conment_spider.py

网上找的关于爬取网易云音乐评论的文件