startOffset must be non-negative, and endOffset must be >= startOffset, and offsets must not go backwards

Question

startOffset must be non-negative, and endOffset must be >= startOffset, and offsets must not go backwards

wqmain opened this issue 5 years ago · 8 comments

wqmain commented 5 years ago

版本 6.x，Pull记录显示已经修复了该问题，但测试问题依旧存在啊
只要配置了 "ignore_pinyin_offset": false 写数据的时候就会报错，
Pull见：#206

Answer 1 · 2020-05-14T09:17:15.000Z

嗯，我这边本地测试环境版本是6.5.1，确实依然存在该问题~
只能将"ignore_pinyin_offset": true才行~

Answer 2 · 2020-06-16T09:38:27.000Z

恩，新的 fix 代码还没有 backport 到 6.x 分支

Answer 3 · 2020-07-30T04:28:30.000Z

7.5.1 问题依旧存在，具体触发情景未，如果文本是已英文加分词开头的，index会出现 lastStartOffset 前移的情况
复现方式，使用readme中的例子，并配置 ignore_pinyin_offset=true

GET /medcl/_analyze
{
  "text": ["liu 德华"],
  "analyzer": "pinyin_analyzer"
}

结果：

{
    "tokens": [
        {
            "token": "liu",
            "start_offset": 1,
            "end_offset": 4,
            "type": "word",
            "position": 0
        },
        {
            "token": "liu 德华",
            "start_offset": 0,
            "end_offset": 6,
            "type": "word",
            "position": 0
        },
       
    ]
}

Answer 4 · 2020-10-09T16:13:08.000Z

请问，这个问题6.x版本有什么临时的解决方案嘛

Answer 5 · 2020-12-09T08:53:48.000Z

7.9.3也有这个问题，不知道是不是哪里没配对。如果是pinyin单独一个字段，好像就没有问题。

Answer 6 · 2021-01-30T07:02:12.000Z

7.10.2一样的错误

Answer 7 · 2021-08-06T08:07:07.000Z

7.6.2 也有这个错误

Answer 8 · 2022-06-28T01:20:52.000Z

7.6.2 也有这个错误
解决了吗