/proxy-fetcher

代理采集器。

Primary LanguagePython

描述

用来采集代理网站的代理IP。

config.py

相关配置,例如采集网站列表、超时时间、校验参数的等。

fetcher.py

代理采集器主程序,采集网站IP代理,输出目录见配置文件。

tester.py

代理IP检查器,也叫测试过滤器。
采集器采集的代理太多,但很多都不可用,用该程序测试可用的代理,输出目录见配置文件。

依赖

依赖thread_pool

使用

git clone https://github.com/kaito-kidd/proxy-fetcher.git

cd proxy-fetcher

git submodule init
git submodule update

# 根据配置的网站采集代理
python fetcher.py

# 测试代理,找出可用的代理
python tester.py

说明

测试可用代理可根据需要调整Pool的大小,详情见config.py