zhegexiaohuozi/JsoupXpath
纯Java实现的支持W3C Xpath 1.0标准语法的HTML解析器。A html parser with xpath base on Jsoup and Antlr4. Maybe it is the best in java.Just try it.
HTMLApache-2.0
Issues
- 0
支持用graalvm打包成native的吗? 想跨平台用
#87 opened by Liloupar - 0
不能识别复杂的标签吗?
#81 opened by flowclouds - 0
JsoupXpath处理含空格字符文本后与原始文本不一致
#80 opened by KamiNoYuki - 0
自定义追加是否存在某个属性的函数,拿不到属性值与入参
#79 opened by zzllkk2003 - 0
多个条件过滤报错
#78 opened by dk19930125 - 0
【通知】此项目以后的任何问题讨论仅接受中文
#77 opened by zhegexiaohuozi - 0
为什么不支持从根节点开始的Xpath
#76 opened by hellokitty-v - 0
是否支持获取绝对路径
#75 opened by MiChongs - 1
获取文本与期望不一致的问题
#73 opened by RainGinx - 4
针对大文件数组优化
#71 opened by Ruffianjiang - 0
【建议】欢迎大家多多贡献内置函数
#70 opened by zhegexiaohuozi - 1
为何注册自定义函数不生效呢
#68 opened by Jason-wam - 2
无法以html根节点匹配
#38 opened by zctmdc - 1
单个节点使用多个条件获取不到元素
#42 opened by hehejl666 - 1
html()提取内容和原html不符
#57 opened by CrazyShaQuiShi - 1
如何猎取元素索引???
#39 opened by ztg-zlu - 3
num()函数提取整数自动转为小数
#63 opened by Ruffianjiang - 1
文档中的轴描述错误
#64 opened by Ruffianjiang - 2
position函数对比不支持count函数
#66 opened by Ruffianjiang - 1
解析出来的结果可以增加一些其他的信息,比如说在源文件的位置等
#48 opened by lwclover - 1
轴函数获取节点顺序错误 preceding-sibling
#65 opened by Ruffianjiang - 1
我不明白,following和following-sibling有什么区别
#32 opened by ztg-zlu - 0
- 1
selOne 执行xpath搜索不到node直接返回null并不友好~
#67 opened by anyoneButNotPeter - 1
请问xpath的matches(string,pattern)方法有吗
#61 opened by huangxuchu - 6
`text()`重构后文本比对逻辑没有同步更新导致的。2.4.3已修复。JsoupXpath表现行为和Xpath1.0标准语法以及Chrome的实现保持一致。Chrome的实现可以通过 `$x("//*[text()='总字数']//text()")`来验证。JsoupXpath的test如下:
#59 opened by gedoor - 3
//*[text()="总字数"]//text()这种规则报错
#53 opened by gedoor - 0
你这个库能升级一下jsoup版本吗,最新版本都1.13.1了
#55 opened by gedoor - 3
`text()`重构后文本比对逻辑没有同步更新导致的。2.4.3已修复。JsoupXpath表现行为和Xpath1.0标准语法以及Chrome的实现保持一致。Chrome的实现可以通过 `$x("//*[text()='总字数']//text()")`来验证。JsoupXpath的test如下:
#54 opened by gedoor - 1
获取text时无法排除掉当前节点下面某些节点text
#43 opened by iLibra - 0
- 0
- 2
text()取得的列表会被自动转为一个字符串,不能按索引取值了
#52 opened by hiliving - 1
- 4
你好,怎么实现抓取包含js渲染的网站
#51 opened by FrankCy - 1
亲还不支持string(.)方法
#50 opened by zhymin77 - 2
a[text()='下一页']获取不到
#31 opened by QAQtutu - 1
如何获取俩个节点之间的 HTML 文本内容
#47 opened by superlins - 1
- 10
- 2
更新2.3.1后JXDocument.create(html) 异常
#36 opened by Antecer - 2
不支持 not()选择的吗?
#33 opened by Antecer - 1
发现新BUG一枚: //@href 选取不到元素
#34 opened by Antecer - 7
- 1
table 中的td标签选择不出来
#23 opened by wuxiongliu1 - 7
- 4
- 1
- 2
- 0
2.x
#21 opened by wuxiongliu1