/E-commerce-crawlers

:rocket:电商网站爬虫合集,淘宝京东亚马逊等

Primary LanguagePython

🚀电子商务网站爬虫合集

1、jd_phone

  • 项目简介:京东搜索全平台所有手机参数信息
  • 作用:这个不仅仅针对手机,其实可以扩展为京东所有类型的商品的信息爬取
  • 主要库: selenium lxml requests json re
  • 信息效果:

2、天猫品牌搜索

  • 项目简介:获取天猫品牌搜索中某个关键词的全部店铺信息(所有店铺名称、链接、相关商品数量、总商品数量等)
  • 作用:可以很直观的得知某个关键词(主要是品牌)所包含的商品信息,包括天猫店铺和店铺中相关商品数量等。这个爬虫获取的数据,对于想要在天猫开店的商家有重大参考意义。
  • 主要库: selenium
  • 信息效果:

3、天猫商品评价标签

  • 项目简介:批量获取天猫单个商品的评价标签关键词
  • 作用:可以从商品标签词中统计出每个商品在买家评论中的优点和缺点,可以帮助商家快速的整改评论不好的商品,提升商品DSR。
  • 主要库: requests
  • 信息效果:

4、模拟登陆淘宝

  • 项目简介:使用账号密码模拟登陆淘宝
  • 作用:登陆了淘宝就可以进一步获取更多信息
  • 主要库: selenium

5、天猫店铺全店商品(手机端)信息提取爬虫

  • 项目简介:爬取指定天猫店铺手机端全店商品信息,包括商品ID、价格、月销量、总销量、标题、链接、主图链接等
  • 不过经过对比页面,发现销售信息有点不符合页面展示的数据,这个具体原由不知道是天猫特意给的错误信息来防止爬虫还是本身的信息是有缓存延迟展现的
  • 主要库: requests json csv
  • 信息效果:

6、天猫店铺全店商品scrapy版

  • 项目简介:爬取手机天猫某个店铺全部商品的基本信息,scrapy 爬虫
  • 主要库: scrapy