Paulzzzhang/ProjectLog

项目进展日志

Python

ProjectLog

项目日志

语音识别的一些基础知识本项目主要内容在于孤立词的评分以及其发音反馈，其中功能将逐步实现

由于需要部署到小程序，因此有域名www.kaldi-speech.cn

现在主要工作在于自己实现DTW与HMM-DNN，对比其效率后期将选择使用Kaldi进行进一步的模型训练

目前主要方向以及进度

单词评分

实现方法

基于DTW与标准语音进行对比

MFCC简单教程
 python_speech_features官方使用文档
 使用Python_speech_features进行MFCC提取
 MFCC的提取过程讲解
 MFCC各种教程动态时间规整
 DTW MFCC和DTW的实现

结果说明：无法定量的描述相对的评分，最终得到的是两者特征向量的平均匹配值，无法达到预想的使用标准，可以直接放弃
基于HMM+DNN的方法

HMM的简单说明

句子评分

重点在于流畅度等