小红书个人主页图片和视频无水印爬取
Python环境 NodeJS环境
运行方法:把你想要的id全部放到列表里
下载速度慢(无需登录)(下载用户列表的笔记)
python normal.py
下载速度快(无需登录)(下载用户列表的笔记)
python normal_quickly.py
多用户下载(下载用户列表所有的笔记)(需登录cookie)
python muti-note.py
多笔记下载(下载笔记列表里所有的笔记)(需登录cookie)
python one-note.py
本项目仅供学习与交流,侵权必删
关于normal
- 如果用户笔记少,推荐使用带有normal的代码,这样不登陆也能爬,不登陆的话小红书只返回前20条笔记,登陆的话返回所有笔记
- 含有normal的可登录,可不登录(删掉bro,自行加上cookie的web_session,不加有时候会卡)
关于muti-note和one-note
- 这俩必须登录,获取cookie,不然就给几条数据
- muti-note处理的是个人主页 https://www.xiaohongshu.com/user/profile/6185ce66000000001000705b
- one-note处理的是笔记详细页 https://www.xiaohongshu.com/explore/64d06670000000000800fb4a
other
- 如果不想费事,不要改代码,用里面的selenium获取cookies即可,注意不要自己关掉浏览器,也不要点击按钮,你只需要微信扫码,或者输入手机验证码,然后等待即可
- 也可以自行将cookies放到目录下cookies.txt中,不要用控制台的document.cookie获取(http only的获取不了),去设置里的应用程序里找,然后把selenium的代码删掉就行
- 有问题992822653@qq.com,回复慢可以直接加QQ