flylzj/weibo-scrapy

a spider based on s.weibo.com

PythonMIT

基于微博搜索的关键词微博和用户信息爬取

项目依赖

scrapy
openpyxl
sqlalchemy
BeautifulSoup
pymysql

运行前的准备

在settings.py中修改WEIBO_Q(这个变量是要搜索的关键词)
配置START_TIME和END_TIME,这两个分别是筛选的开始时间和结束时间
从浏览器复制cookies给COOKIES变量
配置MYSQL_SETTING

运行

scrapy crawl weibo_keywrod 或 python run.py