k2-fsa/sherpa-ncnn

语音中出现重复字符最多只识别两个

Opened this issue · 3 comments

问题:一句话中出现多个重复字符,只识别出两个.如测试呼叫100003,识别结果为1003
环境:银河麒麟 go1.20 (wav文件不支持上传)
步骤:下载项目后,运行go的wav文件转文字demo
809037269cbdaa52f0497bf18bef54a
70fc7880e57733ce61b85e636aa2496

decoder 模型的 context size 只有 2, 要识别重复的字,有点困难。

请教,针对这个问题,直接扩大代码里的context size就行吗?

请教,针对这个问题,直接扩大代码里的context size就行吗?

不行,需要在模型训练的时候做处理. @yfyeung 你有提过解决这个的 pull-request 吗?