- python 3.6.4
- request 2.18.4
- BeautifulSoup (bs3 4.6.0)
- selenium 3.11.0
chromedriver.exe (可根据具体环境而变)
- 进入TrafficSignSpyder文件夹下
- 可直接运行 run.py 脚本,这是一个例程,从汇图网爬取交通标志图片。
- 也可模仿 run.py 脚本,自行选择爬取网页。
- 下载后的图片在 Image 文件夹下
收集网站 | 字符匹配 | 内容下载 | 网页爬取 | 判断网页内容 | 组织代码 | 组织图片 | |
---|---|---|---|---|---|---|---|
蔡文晖 | √ | √ | |||||
陈世杰 | √ | √ | √ | ||||
纪敏智 | √ | √ | √ | √ |