/web_spider

一些爬虫方面的学习小例子

Primary LanguagePython

web_spider

一些爬虫方面的学习小例子

目的

做一些比较有意思的爬虫例子,方便自己使用,也对爬虫技术不断进行学习

已完成

  1. 知乎收藏夹小爬虫: 对于知乎上任何一个收藏夹collection,可以爬在它之中收藏的答案中的所有正文内的图片(说白了就是爬各类妹子爆照贴的图片啦~)

之后目标

学习用一些库,如python的scrapy等

另外还有就是再多加入一些多线程、判重、页面行为(如点击按钮行为)等要素进去

有可能为了能够对图片做更好的筛选,去学习一下图像识别方面的算法