使用混合高斯隐马尔可夫模型完成的14个孤立词的语音识别,其中每个孤立词使用4个HMM建模,每个HMM由3个GMM组成,假设高斯分布中各个维度相互独立
采用librosa模块进行MFCC音频特征提取,MFCC系数阶数取12,同时计算MFCC的差分项,因此GMM的维度是24,
采用viterbi法进行音频的对齐
概率密度函数的计算公式采用的是
训练好的模型(14个HMM-GMM)储存在models.npy文件中
Implementation of isolated word speech recognition using GMM-HMM
PythonGPL-3.0