Constant-Q変換(CQT)によって生成されたスペクトログラムをディープラーニングを使って、疑似的に音源に復元します。
STFTとCQTの二種類を入力とし、CQTのマスクをSTFTに適応することを学習します。 出力はマスク適応後のSTFTになります。
STFTは、原曲を解析し、CQTと同じオクターブで切り抜いたもの、CQTは、適応したいマスクになります。
これによって、CQTで音源分離の学習し、それを音源に復元できるようになります。
Constant-Q変換(CQT)によって生成されたスペクトログラムをディープラーニングを使って、疑似的に音源に復元します。
STFTとCQTの二種類を入力とし、CQTのマスクをSTFTに適応することを学習します。 出力はマスク適応後のSTFTになります。
STFTは、原曲を解析し、CQTと同じオクターブで切り抜いたもの、CQTは、適応したいマスクになります。
これによって、CQTで音源分離の学習し、それを音源に復元できるようになります。