实现了基于NMF的转录,跟随,其中包含了NMF模板提取(训练)过程的重要代码,以及利用模板进行分解的代码。
本仓库和另一个基于C++的NMF的仓库互相呼应,基于C++的NMF仓库只实现了利用已知模板分解(预测)的过程。实际训练和预测中要注意模板中频率的维度和意义,区分是CQT模板还是STFT模板,以及采样率是44100还是8000。同时注意hoplen=512是否是正确的。
前人待解决问题:
-
MAPS数据集中txt文件内的数据与用midi_lib库解析MIDI文件得到的数据不一致。
如:MAPS_MUS-bk_xmas1_ENSTDkAm,MIDI pitch完全对应,onset time最大偏差0.5ms,offset time最大偏差10.03122s。
-
默认采样频率为44100。