Well2333/nonebot-plugin-bilichat

Bug: 专栏解析 API 调用出错:list index out of range

Closed this issue · 10 comments

操作系统

Windows

Python 版本

3.12

NoneBot 版本

2.0

Bilichat 版本

latest

描述问题

随便找了几个专栏试了一下,似乎就是专栏开头是文字的可以解析,但是开头是图片的解析不了
这个就是不行的
https://www.bilibili.com/read/cv35721905/
image
这个可以
https://www.bilibili.com/read/cv34697133/
image

不行的F12看网页的确是搜不到这个//div[@id="read-article-holder"]

插件的配置项

No response

截图或日志

No response

无法稳定复现,考虑是网络波动导致页面未能完全加载,或云端风控?

无法稳定复现,考虑是网络波动导致页面未能完全加载,或云端风控?

我试过挺多次开头是图片的专栏好像就是不行,然后直接F12查看网页元素没有//div[@id="read-article-holder"]

无法稳定复现,考虑是网络波动导致页面未能完全加载,或云端风控?

我试过挺多次开头是图片的专栏好像就是不行,然后直接F12查看网页元素没有//div[@id="read-article-holder"]

我这里怎么刷新都是有的,而且使用 inprivate 模式也能稳定存在,尝试修改为移动端 edge 的 UI 也可稳定存在

image

这个是正常的,不正常的是开头是图片的
https://www.bilibili.com/read/cv35721905
试过几个其他的也是一样
比如这个开头是图片也是不行的
https://www.bilibili.com/read/cv35967927

已复现,read-article-holder 部分的代码是为了提取专栏内的文字信息以用于AI总结和缓存,但对于没有文字的专栏此部分可以直接跳过。
此问题将在下个版本修复。

已复现,read-article-holder 部分的代码是为了提取专栏内的文字信息以用于AI总结和缓存,但对于没有文字的专栏此部分可以直接跳过。 此问题将在下个版本修复。

辛苦了,有些专栏的文字是会出现在最后的,这点也要稍微考虑下

已复现,read-article-holder 部分的代码是为了提取专栏内的文字信息以用于AI总结和缓存,但对于没有文字的专栏此部分可以直接跳过。 此问题将在下个版本修复。

辛苦了,有些专栏的文字是会出现在最后的,这点也要稍微考虑下

此问题无需考虑,因为搜索是根据 id 进行检索,类似 ctrl f ,因此顺序没有任何影响

此问题无需考虑,因为搜索是根据 id 进行检索,类似 ctrl f ,因此顺序没有任何影响

就像我之前说的,文字不是在开头出现的就没有read-article-holder,如果后面的文字使用其他xpath去匹配的那没问题了