用BELLE-2/Belle-whisper-large-v2-zh识别中文音频，效果还不如Systran/faster-whisper-large-v2？

Question

Closed this issue 5 months ago · 2 comments

作者您好，我用BELLE-2/Belle-whisper-large-v2-zh跑实验效果还不如Systran/faster-whisper-large-v2

按道理在中文数据上finetune的模型性能应该比fasterwhisiper的好才对

我是这么用的

怎么才能弄出好的效果么

感谢

Answer 1 · 2024-02-04T14:22:35.000Z

不清楚你用的这两个模型是怎么样的。微调后提升的是你数据集的准确率。有可能是你微调的数据跟你测试的音频差异较大。