QQQunSpider_Net

使用.Net实现的QQ群信息爬虫

怎么做的

手机版移动QQ调用HTTPS API获取群信息，这个API只需要腾讯统一认证（网页登陆）即可使用。
所以要做的事情就是：模拟腾讯登录(使用浏览器)->请求API

怎么用

打开这个项目的时候会初始化一个Chrome的窗口到腾讯的开发者平台并要求登录
受限于NuGet包的缘故，Chrome要求70-73版本
由于是调用腾讯官网登陆并获取Cookie，程序本身不收集登录情报(用户名和密码)
完成登录后Chrome会自动关闭，程序通过Selenium得到Cookie，用此请求API得到群基本数据

怎么批量用

保存一个Input.txt文件在本地，每行一个关键字
完成了验证步骤之后，程序会自动读取关键字获取群信息，并保存原始JSON（关键字.txt）

能获取的内容

获取群信息
- 群ID
- 群主ID
- 群名
- 群简介
- 群标签（群人数、分类、管理在线等）
- 群头像
获取群详细(仅限已添加的群)
- 群等级(可以获取，未提取)
- 群成员
  - 成员QQ
  - 成员属性
  - 成员标注(是否为恶意成员)
  - 加群时间
  - 最后发言时间
  - 成员群等级
  - 成员昵称
  - 成员群卡片
  - QQ注册时长
获取用户加群列表
- 根据用户类型不同，分管理群、参加群、创建群
获取用户好友列表
- 好友列表包括分组信息

程序有限制

由于鹅厂侧的限制，若结果大于500条则只会返回前500条数据，后面的数据鹅厂会标志isEnd为true导致无法获取
一个QQ号API请求大约每小时100次左右，超出请求会报anti-malicious拉黑，同时该账号正常群请求（手机客户端搜群）也会被封禁
以下部分走的腾讯自有QQ协议，无法获取
- 群管理信息(无需加群即可看到)

TeddyKagurazaka/QQQunSpider_Net

QQQunSpider_Net

怎么做的

怎么用

怎么批量用

能获取的内容

程序有限制