yongxuUSTC/sednn

模型輸入特徵問題請教

JohnChen1124 opened this issue · 7 comments

您好:
非常感謝你們所完成的程式,希望能抽空回答一個小小的問題。模型輸入特徵取完頻譜大小之後有做絕對值,但好像沒有取平方,但在A Regression Approach to Speech Enhancement Based on Deep Neural Networks這篇paper中特徵為log-power spectral,這是有什麼原因嗎?感謝你們~~~

我了解了~所以代碼中的loss function是使用mean absolute error而非mean square error。

在擷取音檔特徵的過程中,將音檔轉換成spectrogram大小值之後有做絕對值,也有取log,但好像沒有取平方,是因為loss function改變而做的調整嗎?感謝您~

真的很感謝您的回覆,您說的log Mel spectrogram與Mel Filter Bank有關係嗎?log Mel spectrogram沒有取平方也是因為PESQ的測量結果嗎?

log Mel spectrogram沒有取平方也是因為PESQ的測量結果嗎?還是因為loss改變而跟著改變呢?感謝您~