语音识别的一些基础知识 本项目主要内容在于孤立词的评分以及其发音反馈,其中功能将逐步实现
由于需要部署到小程序,因此有域名www.kaldi-speech.cn
现在主要工作在于自己实现DTW与HMM-DNN,对比其效率 后期将选择使用Kaldi进行进一步的模型训练
目前主要方向以及进度
实现方法
-
MFCC简单教程
python_speech_features官方使用文档
使用Python_speech_features进行MFCC提取
MFCC的提取过程讲解
MFCC各种教程 动态时间规整
DTW MFCC和DTW的实现结果说明:无法定量的描述相对的评分,最终得到的是两者特征向量的平均匹配值,无法达到预想的使用标准,可以直接放弃
重点在于流畅度等