通过 JavaScript + xlsx,基于浏览器端实现对小红书的推荐列表进行数据爬取。
- 爬取的数据量为 100 条
- 每次操作延迟 2 秒
- 每爬取 45 条数据后休息 3 分钟
- 爬取的点赞数大于 100
- 爬取的数据包括:链接、点赞数、标题、正文、日期、收藏数
- 爬取的数据导出为 xlsx 格式的 excel 文件
- 打开小红书网页
- 打开控制台
- 复制粘贴代码
- 回车
- 等待
使用油猴 tampermonkey 添加脚本
- 拉取推荐列表
- 拉取作品详情
- 导出 Excel
- 防封策略
不支持搜索后爬虫。
本项目只提供学习,禁止用于商业项目。