/crwa

selenium+jsoup+springboot+mybatis 爬取网页数据

Primary LanguageJava

crwa

selenium+jsoup+springboot+mybatis 爬取网页数据

用户须知

  • 1.因为爬虫采用的selenium测试工具模拟人为操作浏览器页面,所浏览器必须搭配对应版本的 建议装谷歌浏览器 79.0.3945.79版本,然后将selenium对应驱动chromedriver.exe驱动放在D盘目录下 自此启动环境已经准备好了。
  • 2.自行改造拉取网址页面,需要先去学习jsoup解析html,这个不难,上手很快
  • 3.核心代码就是

avatar