IT桔子官网 - https://www.itjuzi.com/
Author | 😎Henryhaohao😎 |
---|---|
- 项目介绍:该项目为爬取IT桔子10万+公司信息
- 爬取内容:通过IT雷达**公司信息展示平台,爬取了101865家公司信息(包括公司名、logo、城市、上市情况、融资情况等)
- 爬取方式:我爬取时刚注册赠送了会员,可以查看后面页数的公司信息,而目前由于IT雷达需要会员注册方可查看后面页数的公司,所以此代码需带入会员的登录cookie才可行
- 运行方法: 直接运行Spider目录下的main.py即可
- 数据截图:
Version: Python3
MongoDB
pip3 install -r requirements.txt