/BanBadWebsites

又一个屏蔽中文世界爬虫、机器翻译等 SEO 垃圾网站的浏览器用户脚本。

Primary LanguageJavaScriptGNU General Public License v3.0GPL-3.0

Ban Bad Websites

GitHub Greasy Fork

一个屏蔽中文世界垃圾网站的浏览器用户脚本。此脚本会遍历所有的 <a> 标签,匹配域名和 URL 前缀黑名单,识别指向垃圾网站的超链接。根据用户配置,可以高亮标记/屏蔽/删除识别出的超链接。

垃圾网站黑名单类型:

  • 机器翻译爬虫采集站、内容农场、SEO 垃圾站群,例如爬 Stack Overflow 并进行机器翻译的网站
  • 博彩网站,被搜索引擎搜到时看起来是正常网站,点击后进入博彩网站
  • 低质量博客、下载站

本项目特色:

  • 不是特定网站的针对性脚本,而是处理所有网页的所有 <a> 标签超链接
  • 可以改变超链接外观(颜色、背景色、边框、装饰线等),让用户在点击之前就意识到,哪些链接指向垃圾网站

效果

默认设置:

screenshot1.png

安装

首先你的浏览器需要安装一个用户脚本管理器。如果没有安装,请查看这个帮助页面

进入 Greasy Fork 中此项目的页面,点击安装此脚本按钮,自动弹出用户脚本管理器界面,按照提示操作即可。

设置

编辑源代码 Start User ConfigEnd User config 之间的代码,可以启动/关闭以下功能。

  • option_highlight_link:突出显示目标超链接,改变链接的外观、指针样式等
  • option_disable_link:使目标超链接无法点击。不推荐,因为垃圾网站有时候还有一定参考价值,必要时可能仍然需要点击访问
  • option_remove_link:隐藏目标超链接。不推荐,因为此脚本不是特定网站的针对性脚本,无法完美删除目标超链接,可能会导致网页显示错乱

TODO: 研究如何用方便的 GUI 进行设置,如何持久化设置。

TODO: 支持设置屏蔽网站的类型。

FAQ

为什么对百度搜索结果中的链接无效?

百度搜索结果中的链接并不是目标的实际 URL,而是形式类似 https://www.baidu.com/link?url=1234ABCD 的 URL,其中的 link 参数使用了某种编码/加密,需要先请求百度服务器,才能跳转到真实 URL。所以此用户脚本无法处理百度搜索结果链接。

使用这个用户脚本的应该都是讲究人,不会还在用百度吧?如果一定要用,可以尝试和某些去除重定向的用户脚本配合使用(未测试)。

初始黑名单来源参考

类似项目推荐

License

This project is licensed under the GNU General Public License v3.0