怎么获得自定义“关键词”识别模型？

Question

怎么获得自定义“关键词”识别模型？

BarryKCL opened this issue 2 years ago · 13 comments

BarryKCL commented 2 years ago

我用TTS(100个发音人左右)生成自己的“关键词”数据，训练之后发现效果不太好。

Answer 1 · 2023-02-24T12:27:46.000Z

你说的关键词是指热词吗？

如果是热词，可以参考WFST的方案 https://mp.weixin.qq.com/s/5FLXU-jUjUVcpXtQaJbhfA

如果是命令词这种，建议自己用手机实际录制一些

Answer 2 · 2023-02-27T02:45:05.000Z

再训练好的开源数据集模型上，添加TTS造的"唤醒词"以及少量录制的数据，fineturn得到自定义的唤醒词模型，这个方案可行吗？

Answer 3 · 2023-03-11T05:12:30.000Z

可以试一下，直觉上我认为最终的效果跟你用的开源数据集有很大关系。数据越多并且关键词种类越多最终 finetune 的效果应该会越好

Answer 4 · 2023-03-23T07:02:22.000Z

请问noise_lmdb文件要怎么获取？

Answer 5 · 2023-03-23T07:02:27.000Z

请问noise_lmdb文件要怎么获取？

Answer 6 · 2023-03-23T07:02:42.000Z

请问noise_lmdb文件要怎么获取？

Answer 7 · 2023-06-03T08:04:20.000Z

Maybe you can try this PR. #135

Answer 8 · 2024-09-03T01:46:03.000Z

再训练好的开源数据集模型上，添加TTS造的"唤醒词"以及少量录制的数据，fineturn得到自定义的唤醒词模型，这个方案可行吗？

你尝试的效果怎么样，我用tts生成的关键词音频效果不太好

Answer 9 · 2024-09-10T05:46:49.000Z

再训练好的开源数据集模型上，添加TTS造的"唤醒词"以及少量录制的数据，fineturn得到自定义的唤醒词模型，这个方案可行吗？

你尝试的效果怎么样，我用tts生成的关键词音频效果不太好

你好，请问你用的是什么TTS工具？

Answer 10 · 2024-09-12T07:07:17.000Z

再训练好的开源数据集模型上，添加TTS造的"唤醒词"以及少量录制的数据，fineturn得到自定义的唤醒词模型，这个方案可行吗？

你尝试的效果怎么样，我用tts生成的关键词音频效果不太好

你好，请问你用的是什么TTS工具？
调的百度，讯飞，腾讯的语音合成接口合成的

Answer 11 · 2024-09-12T07:11:48.000Z

再训练好的开源数据集模型上，添加TTS造的"唤醒词"以及少量录制的数据，fineturn得到自定义的唤醒词模型，这个方案可行吗？

你尝试的效果怎么样，我用tts生成的关键词音频效果不太好

你好，请问你用的是什么TTS工具？
调的百度，讯飞，腾讯的语音合成接口合成的

用不同接口的TTS交叉验证结果不太好吗？还是用麦克风出来的效果一般？

Answer 12 · 2024-09-12T07:17:20.000Z

再训练好的开源数据集模型上，添加TTS造的"唤醒词"以及少量录制的数据，fineturn得到自定义的唤醒词模型，这个方案可行吗？

你尝试的效果怎么样，我用tts生成的关键词音频效果不太好

你好，请问你用的是什么TTS工具？
调的百度，讯飞，腾讯的语音合成接口合成的

用不同接口的TTS交叉验证结果不太好吗？还是用麦克风出来的效果一般？

训练完实际测试的时候唤醒率不高，五成左右吧，合成的还是和真人语音频谱有区别。

Answer 13 · 2024-09-12T08:05:56.000Z

再训练好的开源数据集模型上，添加TTS造的"唤醒词"以及少量录制的数据，fineturn得到自定义的唤醒词模型，这个方案可行吗？

你尝试的效果怎么样，我用tts生成的关键词音频效果不太好

你好，请问你用的是什么TTS工具？
调的百度，讯飞，腾讯的语音合成接口合成的

用不同接口的TTS交叉验证结果不太好吗？还是用麦克风出来的效果一般？

训练完实际测试的时候唤醒率不高，五成左右吧，合成的还是和真人语音频谱有区别。

ok