其他版本
之前写多线程/多进程爬虫基本上都是使用 requests,而 Python3 最大的魅力可能就是异步编程了。本爬虫以 asyncio 为基础,使用了 aiohttp/aiofiles 两个第三方异步库。
图片地址数据保存在了 data.txt
,共 17w+ 张照片,图片的数据是我从 mmjpg 和 mzitu 里提取出来的。
$ wc -l data.txt
178075 data.txt
$ git clone https://github.com/chenjiandongx/photo-asyncio.git
$ cd photo-asyncio
$ pip install -r requirements.txt # 安装依赖
$ python core.py
MIT ©chenjiandongx