/simDHT

屎上最简单的DHT爬虫

Primary LanguagePythonMIT LicenseMIT

simDHT:

  1. 屎上代码最简单的DHT爬虫, 基于twisted/Kademlia, 很适合初学者学习.
  2. 在CPU: 单核 内存:512 带宽: 100Mbps 的国外Xen VPS下, 每二十四小时能收集200万(运气加理论)的独一无二的infohash. 若是在最低配置阿里云主机下, 效率更好.
  3. 在内网环境下, 也许没效果, 可以的话, 尽量放在公网上, 比如买一个VPS.

依赖包:

  1. twisted, twisted依赖zope.interface
  2. bencode

启动simDHT服务:

twistd -y simDHT.py

停止simDHT服务:

  1. cat twistd.pid
  2. kill -9 PID

配置文件:

kademlia/constants.py

其他:

  1. 因只实现了DHT协议, 未实现种子下载, 所收集到的infohash将会存储在infohash.log文件中.
  2. 种子下载可去迅雷种子库下载、使用libtorrent、实现种子协议(bep0003, bep0009, bep0010)