/spyder_stadiumgoods

爬取国外一球鞋网站

Primary LanguagePythonApache License 2.0Apache-2.0

spyder_stadiumgoods

爬取国外一球鞋网站https://www.stadiumgoods.com

写在前面

该项目是于2019年于某鱼平台上接单,帮助开发的一个爬取球鞋网站https://www.stadiumgoods.com各商品数据的一个脚本

感兴趣可联系zidutian@gmail.com

我的主页https://imygirl.github.io/

说明:

  1. result.md中记录了colab平台上的运行结果,可参考;

  2. 在主程序中添加 url 即可运行 code.py 文件;

  3. 运行 code.py 文件生成的csv文件为分页爬取结果;

  4. 可通过其他脚本将分页爬取结果汇总至一个文件中;

  5. 主要通过BeautifulSoup数据包单线程爬取,分析url指向页面,伪装header爬取,主体程序架构如下:

--># 爬取所有搜索页面的url

  --># 爬取各搜索页中各详情页的url
      for i in 所有搜索页面的url:
      
    --># 进入详情页,爬取各页面的详情参数
        for j in 各搜索页中各详情页的url:
        ...

爬取结果

data01.csv