使用.Net实现的QQ群信息爬虫
手机版移动QQ调用HTTPS API获取群信息,这个API只需要腾讯统一认证(网页登陆)即可使用。
所以要做的事情就是:模拟腾讯登录(使用浏览器)->请求API
打开这个项目的时候会初始化一个Chrome的窗口到腾讯的开发者平台并要求登录
受限于NuGet包的缘故,Chrome要求70-73版本
由于是调用腾讯官网登陆并获取Cookie,程序本身不收集登录情报(用户名和密码)
完成登录后Chrome会自动关闭,程序通过Selenium得到Cookie,用此请求API得到群基本数据
保存一个Input.txt文件在本地,每行一个关键字
完成了验证步骤之后,程序会自动读取关键字获取群信息,并保存原始JSON(关键字.txt)
- 获取群信息
- 群ID
- 群主ID
- 群名
- 群简介
- 群标签(群人数、分类、管理在线等)
- 群头像
- 获取群详细(仅限已添加的群)
- 群等级(可以获取,未提取)
- 群成员
- 成员QQ
- 成员属性
- 成员标注(是否为恶意成员)
- 加群时间
- 最后发言时间
- 成员群等级
- 成员昵称
- 成员群卡片
- QQ注册时长
- 获取用户加群列表
- 根据用户类型不同,分管理群、参加群、创建群
- 获取用户好友列表
- 好友列表包括分组信息
- 由于鹅厂侧的限制,若结果大于500条则只会返回前500条数据,后面的数据鹅厂会标志isEnd为true导致无法获取
- 一个QQ号API请求大约每小时100次左右,超出请求会报anti-malicious拉黑,同时该账号正常群请求(手机客户端搜群)也会被封禁
- 以下部分走的腾讯自有QQ协议,无法获取
- 群管理信息(无需加群即可看到)