是spectrogram还是mfcc特征呢?
lywhz opened this issue · 7 comments
你好,我看了代码,有个地方一直没有明白:语音数据预处理的后,输入到神经网络的是声谱图(spectrogram)还是梅尔声谱图(mel-spectrogram)还是mfcc特征呢?麻烦您解答一下,谢谢!!
可以选择的:
Line 30 in bc4418f
您好,我是去年下载的您代码,和这个版本不一样,请问您之前的这个函数的返回值spec是声谱图(spectrogram)还是梅尔声谱图(mel-spectrogram)还是mfcc特征呢?
def spectrogram(wav, normalize=True): #
D = librosa.stft(wav, n_fft=n_fft, hop_length=hop_length, win_length=win_length, window=window)
spec, phase = librosa.magphase(D)
spec = np.log1p(spec)
spec = torch.FloatTensor(spec) # 转化为Tensor
if normalize:
spec = (spec - spec.mean()) / spec.std()
return spec
`
def spectrogram(wav, normalize=True): #
D = librosa.stft(wav, n_fft=n_fft, hop_length=hop_length, win_length=win_length, window=window)
spec, phase = librosa.magphase(D)
spec = np.log1p(spec)
spec = torch.FloatTensor(spec) # 转化为Tensor
if normalize:
spec = (spec - spec.mean()) / spec.std()
return spec
`
这个是一个声谱图
是的,我用的是您这个分支。在您这个版本中,您输入到神经网络中的数据是这个函数返回的声谱图是吧
是的、