/ImageSpider

百度图片爬虫,可以爬取原图

Primary LanguagePython

ImageSpider

通过搜索引擎进行图片爬虫,可以爬取原图(目前实现 百度和必应的爬虫)

环境需要

  1. Python 3.X
  2. selenium (可通过 pip install selenium 安装)

使用方法

  1. 进入main.py文件
  2. 修改搜索起始页面的地址(注意是原图的浏览页面)
  3. 修改存储位置
  4. Just run it !

需要注意

  1. 推荐使用Chrome浏览器
  2. 请在Chrom浏览器的“帮助” -> “关于Google Chrome(G)”中查询当前浏览器版本,例如“版本 75.0.3770.100(正式版本) (64 位)”表示当前主版本为75.
  3. 可以到 http://npm.taobao.org/mirrors/chromedriver/ 下载对应主版本的chromedriver,并放在driver目录下
  4. 打开百度图片(必应图片),搜索相关词条,并进入大图页面,复制浏览器地址作为BAIDU_URL或BING_URL (注意:需要进入大图页面!!)
  5. 运行爬虫,enjoy it~

如果喜欢这个爬虫,请star一下,特别感谢!