Luna是专为抗指纹自动化爬虫设计的工具,包含抗指纹浏览器和自动化框架,让您能够自由实现所需功能。
作者QQ: 80258153
python版本框架:准备升级原生态版本;所以暂时删除掉基于golang版本封装的python版 任何问题直接咨询作者本人,不在设置QQ技术交流群。
经过大量测试,目前基本可以过掉主流抗指纹识别;
测试网址:
https://www.browserscan.net/
https://uutool.cn/browser/
https://abrahamjuliot.github.io/creepjs/
1、目前仅支持 Windows x86-64 架构,其他平台测试尚不充分。
2、mac arm版仅提供开发时测试、并不能用于生产环境、因为大部分指纹并不支持。
详细的使用说明和示例代码,请查看本项目的文档。
示例代码部分也可以查看源码的test_case包下内容。
目前,我们已经将浏览器文件上传到 百度 网盘,并提供了下载链接:
新版本-win-[670MB]连接:链接:https://pan.baidu.com/s/1S3ZdbFHTtaZgW2dInc6JDA 提取码:3pmd
<win版本-没有授权文件的用户,仅可以测试useragent指纹部分,其他指纹不会生效,如何获取授权文件联系作者获取;>
指纹项 | |
---|---|
user_agent指纹 | |
canvas指纹 | |
webgl指纹 | |
platform平台 | |
timezone时区 | |
timezone_offset时区偏移量 | |
languages语言 | |
userAgentData | |
header 修改 | |
deviceMemory | |
hardwareConcurrency | |
UNMASKED_VENDOR_WEBGL | |
UNMASKED_RENDERER_WEBGL | |
GL_VERSION | |
GL_SupportedExtensions | |
GL_VENDOR | |
GL_RENDERER | |
GL_SHADING_LANGUAGE_VERSION | |
是否webdriver | |
是否brave | |
是否selenium | |
是否来自于真实键盘 | |
是否来自于真实鼠标 | |
鼠标移动轨迹 | |
其他机器人检测 | |
webRTC | |
screen | |
声卡指纹 |
引入包: go get -u github.com/musiclover789/luna
package main
import (
"fmt"
"github.com/musiclover789/luna/devtools"
"time"
)
func main() {
// 初始化浏览器对象
//你浏览器的地址
//chromiumPath := "/Users/你自己的浏览器的地址/Chromium.app/Contents/MacOS/Chromium"
chromiumPath := "C:\\src\\chromedev\\chromium\\src\\out\\Default/chrome.exe"
_, browserObj := devtools.NewBrowser(chromiumPath, &devtools.BrowserOptions{
// 设置非隐身模式
Headless: false,
})
// 打开一个页面 如果你想看更多示例 请参考文档 https://github.com/musiclover789/luna-browser
browserObj.OpenPage("https://www.baidu.com")
fmt.Println("恭喜你,非常nice的第一个案例")
time.Sleep(1 * time.Hour)
}
相关文档:
第一课-常见概念介绍.md |
---|
第三课-brower对象.md |
第二课-第一个小例子.md |
第五课.md |
第四课page对象.md |
框架相关文档
框架文档.md |
如何设置指纹.md |
完整文档参考: https://github.com/musiclover789/luna-browser
备注: 具体指纹修改项,请参阅上面表格部分。
Luna 基于视觉的页面操作方法让您可以使用截图的方式来控制浏览器,也支持传统的 CSS 和 XPath 选择器等方式。这意味着您可以立即看到页面上的内容并执行操作,而不必等待特定事件触发。
这一特性的最大优势在于速度,因为您可以像人一样看到什么就可以操作什么。这样的交互方式使得 Luna 极为高效。
Luna 支持市面上所有类型的代理 IP,包括 HTTP、HTTPS 和 SOCKS5,无论代理 IP 是否需要密码,Luna 都完全兼容。理论上,使用 Luna 进行爬取的请求将无法被追踪。
Luna 考虑到了多进程和多线程的应用场景,使得您可以并发执行多个任务,提高了爬虫的效率。
Luna 考虑到了、可能会协议和浏览器混编的方式、和可能的协议采集需求,所以继承了比较完备的cookie方案,和数据包过滤方案、方便采集数据使用、已经封装了比较完善的 一对一 请求过滤。
- 如果您不用防指纹识别部分功能、就下载普通的chrome浏览器即可。
- 另外、鼠标移动轨迹、键盘输入、鼠标滚轮、如果没有luna浏览器配合、那么依然会被轻易识别为机器人。
1、可以自己随便修改指纹吗?
答:是的、理论上无限指纹;
2、目前支持Linux 系统吗?
答:暂时不支持、
3、原理是?
答:修改chromium内核。
4、有体积更小的浏览器么?
答:无、参考新版。
5、为什么我测试基于视觉时候发现,出现bug
答:下载代码后不要修我的项目名字 叫luna
6、第三方库可以用的么,如Selenium Pyppeteer Playwright 。
答:不支持、经过大量测试、发现第三方框架特别容易被识别为cdp控制;
不信,你就拿www.browserscan.net测试一下,所以不再兼容第三方框架,不要反复问了。
抗指纹部分需要授权 <非付费用户,只能测试useragent 部分效果> 授权联系-QQ: 80158153