具体内容见pdf
这个是我在20年下学期的作业,有人提issue说运行不了,结果是
不仅fake useragent挂了,连weibo.cn的关键词搜索接口都失效了(2021.6.6)
只要把爬虫文件里的cookie换成你的应该就跑的起来
当然还要改日期和关键词
数据科学基础大作业:实现的技术包括利用python爬虫,爬取关键词搜索的微博正文,特定微博下的评论;预处理微博文本;手写textRank;聚类,kmeans,DBSCAN,层次聚类;情感词典情感分析;pyecharts可视化绘图
HTML