/vscrawler

Primary LanguageJavaApache License 2.0Apache-2.0

看文档,不吹逼,不被批

http://vscrawler.virjar.com/ http://vscrawler.scumall.com/

maven坐标

<dependency>
      <groupId>com.virjar</groupId>
      <artifactId>vscrawler-core</artifactId>
      <version>0.2.0</version>
</dependency>

QQ群:

569543649(VS系列统一交流群,目前包含DungProxy,VSCrawler,SipSoup三个项目)

history

  1. 0.0.x vs基础结构确定
  2. 0.1.x 对数据抽取进行完整设计,包括xpath、链式抽取、字符串函数集、表格数据定位
  3. 0.2.x 支持运行多个爬虫实例(context隔离)