/spider_lagou

爬拉勾网的爬虫,使用java多线程,以及httpclient和jsoup。爬取了所有的公司信息

Primary LanguageJava

爬拉勾网的爬虫,使用java多线程,以及httpclient和jsoup。爬取了所有的公司信息 运行时候把cookie换成你自己的cookie,这个通过开发者工具可以看到 基于生产者消费者模式的阻塞队列