语音中出现重复字符最多只识别两个

Question

Opened this issue 10 months ago · 3 comments

问题:一句话中出现多个重复字符,只识别出两个.如测试呼叫100003,识别结果为1003
环境:银河麒麟 go1.20 (wav文件不支持上传)
步骤:下载项目后,运行go的wav文件转文字demo

Answer 1 · 2023-09-19T12:14:41.000Z

decoder 模型的 context size 只有 2，要识别重复的字，有点困难。

Answer 2 · 2023-10-12T09:56:35.000Z

请教，针对这个问题，直接扩大代码里的context size就行吗？

Answer 3 · 2023-10-12T11:09:03.000Z

请教，针对这个问题，直接扩大代码里的context size就行吗？

不行，需要在模型训练的时候做处理. @yfyeung 你有提过解决这个的 pull-request 吗？