nostDHT:
- 屎上代码最简单的DHT爬虫, 基于twisted/Kademlia, 很适合中级者学习.
- nostDHT就是no standard DHT的简写, 顾名思义就是相对于simDHT来说, 跟官方协议不标准.
- 比simDHT好的地方在于不需要维护路由表里的node状态, 因为永远都是最新鲜的, 且代码量更少, 每天收集的infohash数量几乎都是一样的.
- 在内网环境下, 也许没效果, 可以的话, 尽量放在公网上, 比如买一个VPS.
依赖包:
- twisted, twisted依赖zope.interface
- bencode
启动nostDHT服务:
twistd -y nostDHT.py
停止nostDHT服务:
cat twistd.pid
kill -9 PID
配置文件:
kademlia/constants.py
其他:
- 因只实现了DHT协议, 未实现种子下载, 所收集到的infohash将会存储在infohash.log文件中.
- 种子下载可去迅雷种子库下载、使用libtorrent、实现种子协议(bep0003, bep0009, bep0010)