- 屎上代码最简单的DHT爬虫, 基于twisted/Kademlia, 很适合初学者学习.
- 在CPU: 单核 内存:512 带宽: 100Mbps 的国外Xen VPS下, 每二十四小时能收集200万(运气加理论)的独一无二的infohash. 若是在最低配置阿里云主机下, 效率更好.
- 在内网环境下, 也许没效果, 可以的话, 尽量放在公网上, 比如买一个VPS.
- twisted, twisted依赖zope.interface
- bencode
twistd -y simDHT.py
cat twistd.pid
kill -9 PID
kademlia/constants.py
- 因只实现了DHT协议, 未实现种子下载, 所收集到的infohash将会存储在infohash.log文件中.
- 种子下载可去迅雷种子库下载、使用libtorrent、实现种子协议(bep0003, bep0009, bep0010)