/crawl

有关爬虫

Primary LanguageHTML

项目名称

版本免责声明

本仓库中的代码是根据以下条件提供的:

  1. 作者不对代码的任何使用承担任何责任。作者不承担任何明示或暗示的保证,包括但不限于适销性或特定用途适用性的保证。使用本代码的风险由用户自行承担。
  2. 本代码中的示例可能仅供演示和教育目的使用。在使用示例代码时,请确保了解并遵守相关法律法规和第三方服务的条款。
  3. 仓库代码全部收集于互联网。
  4. 如果你觉得本代码涉及侵权,请联系删除[yuchajia@gmail.com]。

在使用本项目的代码和功能之前,请您认真考虑并接受以上免责声明。如果您对上述声明有任何疑问或不同意,请不要使用本项目的代码和功能。如果您使用了本项目的代码和功能,则视为您已完全理解并接受上述免责声明,并自愿承担使用本项目的一切风险和后果。

说明

  • 本仓库仅展示部分架构,是多个项目整合到了一起太乱了,不展示内容包括(接口关键参数逆向,request关键接口的内容,以及其他涉密数据),是直接从本地仓库复制过去的,有时候cookies池,ip池等都忘了删。。。APP的内容暂时不提交到仓库

  • 大部分内容都是在linux环境下测试过的,就是有些提取规则应该要更新了

  • IE浏览器是处理一些涉密数据,比如财务数据。这里我测试环境是win8,win7试过了不行,还有需要注意的点是,安装的pycharm需要手动配置环境,会报路径过长的错误