/alibaba

阿里巴巴店铺商品爬虫

Primary LanguageJavaScript

阿里巴巴店铺爬虫

这个爬虫使用Java写的,但是上边显示的是JavaScript ,我很无奈,,,

小说明
  • 爬虫不用登陆,不用各种防封,所以还是比较简单的。

  • 难点在于获取商品信息时,是利用ajax加载的。

  • 这里我用到了phantomjs

  • 商品信息我放在了***j:\淘宝\***下,这个需要你自己建

  • 启动爬虫后输入店铺的url就可以了,例如:

    • https://****.1688.com
  • 启动之后就可以完美运行了,速度较慢。相对于人工来说还是很快的