新浪微博 Golang 版 SDK
代码组织结构已按新浪微博提供的接口拆分,已支持的功能列表:
官方 API:
- 获取 Authorize Code
- 获取 Access Token
- 查询 Access Token 信息
- 分享一条链接到微博(发微博)
- 获取当前登录用户所发出的评论列表
- 获取当前登录用户所收到的评论列表
- 对一条微博进行评论
- 根据评论 ID 批量删除评论
- 获取微博官方表情的详细信息
- 获取当前登录用户及其所关注(授权)用户的最新微博
- 回复一条评论
- 根据评论 ID 批量返回评论信息
- 获取某个用户最新发表的微博列表
- 根据 ID 跳转到单条微博页
- 批量获取指定微博的转发数评论数
- 根据用户 ID 获取用户信息
- 获取最新的提到登录用户的微博列表,即 @ 我的微博
- 根据微博 ID 返回某条微博的评论列表
- 根据微博 ID 获取单条微博内容
- 获取指定微博的转发微博列表
- 通过个性化域名获取用户资料以及用户最新的一条微博
- 获取当前登录用户的最新评论包括接收到的与发出的评论
- 返回最新的公共微博
非官方 API: (登录后解析 HTML 结果)
模拟电脑浏览器登录(已不可用)- 二维码扫码登录
- 注册验证码破解函数
- 微博热搜:热搜榜、要闻榜、好友搜
- 微博搜索:(微博搜索页面综合关键字搜索,支持高级搜索)
- 获取微博高级搜索选项中的省市编号
- 微博发布时间标准化
使用账号密码模拟登录微博后获取授权码,从 url 中取得授权码后再获取 token ,过程中无需人工干预。
默认触发验证码时,将验证码保存在临时目录中,提示用户人工处理,手动输入验证码后继续后续逻辑,期间会尝试显示验证码图片,若失败则需要人工去提示路径下打开图片。
支持注册破解验证码的函数,注册后触发验证码时,优先使用注册的函数识别验证码,如果识别失败则仍然采用提示用户手动输入。
破解函数的声明为 func(io.Reader) (string, error)
,只要符合此签名的函数就可以调用 RegisterCrackPinFunc
方法注册。RegisterCrackPinFunc
可以传入多个破解函数,会逐个尝试。
go get -u -v github.com/axiaoxin-com/weibo
https://godoc.org/github.com/axiaoxin-com/weibo
// 发送文本内容示例
package main
import (
"fmt"
"log"
"os"
"github.com/axiaoxin-com/weibo"
)
func main() {
// 从环境变量获取必须的账号信息
appkey := os.Getenv("weibo_app_key")
appsecret := os.Getenv("weibo_app_secret")
username := os.Getenv("weibo_username")
passwd := os.Getenv("weibo_passwd")
redirecturi := os.Getenv("weibo_redirect_uri")
securitydomain := os.Getenv("weibo_security_domain")
// 初始化客户端
weibo := weibo.New(appkey, appsecret, username, passwd, redirecturi)
// 登录微博
if err := weibo.PCLogin(); err != nil {
log.Fatal(err)
}
// 获取授权码
code, err := weibo.Authorize()
if err != nil {
log.Fatal(err)
}
// 获取 access token
token, err := weibo.AccessToken(code)
if err != nil {
log.Fatal(err)
}
// 发送微博,必须带有安全域名链接
status := fmt.Sprintf("文本内容 http://%s", securitydomain)
resp, err := weibo.StatusesShare(token.AccessToken, status, nil)
if err != nil {
log.Println(err)
}
log.Println("微博发送成功 详情点击 http://weibo.com/" + resp.User.ProfileURL)
}
// 发送带图片的文本内容示例
package main
import (
"fmt"
"log"
"os"
"github.com/axiaoxin-com/weibo"
)
func main() {
// 从环境变量获取必须的账号信息
appkey := os.Getenv("weibo_app_key")
appsecret := os.Getenv("weibo_app_secret")
username := os.Getenv("weibo_username")
passwd := os.Getenv("weibo_passwd")
redirecturi := os.Getenv("weibo_redirect_uri")
securitydomain := os.Getenv("weibo_security_domain")
// 初始化客户端
weibo := weibo.New(appkey, appsecret, username, passwd, redirecturi)
// 登录微博
if err := weibo.PCLogin(); err != nil {
log.Fatal(err)
}
// 获取授权码
code, err := weibo.Authorize()
if err != nil {
log.Fatal(err)
}
// 获取 access token
token, err := weibo.AccessToken(code)
if err != nil {
log.Fatal(err)
}
// 发送微博,必须带有安全域名链接
status := fmt.Sprintf("文字带图片示例 http://%s", securitydomain)
// 加载要发送的图片,加载方式只要是返回 io.Reader 都可以
pic, err := os.Open("./pic.jpg")
if err != nil {
log.Fatal(err)
}
defer pic.Close()
resp, err := weibo.StatusesShare(token.AccessToken, status, pic)
if err != nil {
log.Println(err)
}
log.Println("微博发送成功 详情点击 http://weibo.com/" + resp.User.ProfileURL)
}
// 注册验证码破解函数示例
// 登录遇到验证码时
// 如果有注册你自己的破解函数则会尝试使用你注册的函数进行验证码破解
// 破解失败则采用默认的人工手动处理的方式手工输入保存在临时目录中的 weibo_pin.png 中的验证码
package main
import (
"fmt"
"log"
"os"
"github.com/axiaoxin-com/chaojiying"
"github.com/axiaoxin-com/weibo"
)
func main() {
// 从环境变量获取必须的账号信息
appkey := os.Getenv("weibo_app_key")
appsecret := os.Getenv("weibo_app_secret")
username := os.Getenv("weibo_username")
passwd := os.Getenv("weibo_passwd")
redirecturi := os.Getenv("weibo_redirect_uri")
securitydomain := os.Getenv("weibo_security_domain")
// 初始化客户端
weibo := weibo.New(appkey, appsecret, username, passwd, redirecturi)
// 使用超级鹰破解验证码
// 初始化超级鹰客户端
chaojiyingUser := os.Getenv("chaojiying_user")
chaojiyingPass := os.Getenv("chaojiying_pass")
chaojiyingAccount := chaojiying.Account{User: chaojiyingUser, Pass: chaojiyingPass}
cracker, err := chaojiying.New([]chaojiying.Account{chaojiyingAccount})
if err != nil {
log.Println(err)
}
// 将破解函数注册到微博客户端
// 破解函数的声明为 func(io.Reader) (string, error),只要符合此签名的函数就可以注册
// RegisterCrackPinFunc 可以传入多个破解函数,会逐个尝试
// 这里的 Cr4ck 即为 chaojiying 中的破解函数
weibo.RegisterCrackPinFunc(cracker.Cr4ck)
fmt.Println("验证码破解方法注册成功")
// 登录微博 遇到验证码将自动识别
if err := weibo.PCLogin(); err != nil {
log.Fatal(err)
}
// 获取授权码
code, err := weibo.Authorize()
if err != nil {
log.Fatal(err)
}
// 获取 access token
token, err := weibo.AccessToken(code)
if err != nil {
log.Fatal(err)
}
// 发送微博,必须带有安全域名链接
status := fmt.Sprintf("文本内容 http://%s", securitydomain)
resp, err := weibo.StatusesShare(token.AccessToken, status, nil)
if err != nil {
log.Println(err)
}
log.Println("微博发送成功 详情点击 http://weibo.com/" + resp.User.ProfileURL)
}
要想代码层面直接获取到授权码,必须要在微博应用的授权页面进行模拟浏览器登录。
登录参数会被 js 代码处理,需要翻译对应的 js 代码为 go , crypto 包不熟,这里花了一些时间。
貌似不行了,只能使用二维码扫码登录。或者自动登录步骤手动获取授权码后保存 token
最开始的方案是客户端实例化的时候可以接收授权码参数,如果直接传入了授权码则跳过登录逻辑直接去获取 token 就不会触发验证码。 但是这个接口使用体验太差,每次需要先去浏览器中手工授权获取 URL 中的授权码,再将其写入配置中运行时加载,过程相对麻烦; 而且如果为多个微博账号配置各自的授权码时极易忘记退出上一次登录的账号导致获取到的是其他账号的 token 。
在无法自己实现验证码自动识别的事实上,不如将验证码保存到本地,触发验证码时本地直接打开后手动输入即可,只需一次人工干预, 实际应用中通常也只有服务启动时需要登录授权操作,因此这样可以接受。
在调研后发现有超级鹰等类似的验证码识别平台,提供 http 接口破解验证码,于是实现了注册破解函数的模式。 用户可以实现自己的破解方法,只需按约定的出入参数实现即可,注册后当遇到验证码会自动调用处理,失败时再使用人工识别手动输入的方案兜底。
比如微博搜索,未登录和已登录状态下都可以搜索,但是可操作的按钮结果不同,无法使用高级搜索等,对应的解析也不同
需要考虑如何有效优雅的将页面元素和操作抽象为 golang 对象和接口
微博内容有视频时,代码直接读取的 html 是没有浏览器中展示的播放内容的,只有封面图片,需要从属性参数中解析视频地址
已知问题:微博搜索结果中微博的发布时间和来源的网页结构变化较多,没有遇到过的结构可能导致解析失败