beiciliang/intro2musictech

关于音乐分离和音乐转谱

LmYjQ opened this issue · 2 comments

LmYjQ commented

很早就想做机器自动扒谱。目前的想法是end2end应该不太现实?所以想先把音频分成每个声部,再把每个声部转谱。
初步先能实现一个二、三重奏的就好,只考虑旋律乐器,不考虑打击乐。

有几个细节问题想讨论一下:
1.第一步分离,查到了一个facebook的demucs,不知道还没有其他比较好的选择?
2.猜测分离的模型里应该音色是很重要的依据,如果有相同的乐器有多个声部,比如弦乐四重奏里面的一二小提琴,目前解决的程度如何?
3.单旋律转谱对不同乐器的鲁棒性如何?

  1. 声源分离这块可以参考SigSep - Open Resources for Music Source Separation,目前做的最好的应该是audioshake这个公司的不开源方案,其他开源的方案你可以参考链接里的,我很久没看这块进展了所以也不清楚“最好”的是哪个。
  2. 这个目前还做不到╮( •́ω•̀ )╭
  3. 音高分布在高频段的旋律型乐器(adsr中的s很长的乐器,比如小提琴)要好于音高分布在低频段的打击型乐器(比如定音鼓)。
LmYjQ commented
  1. 声源分离这块可以参考SigSep - Open Resources for Music Source Separation,目前做的最好的应该是audioshake这个公司的不开源方案,其他开源的方案你可以参考链接里的,我很久没看这块进展了所以也不清楚“最好”的是哪个。
  2. 这个目前还做不到╮( •́ω•̀ )╭
  3. 音高分布在高频段的旋律型乐器(adsr中的s很长的乐器,比如小提琴)要好于音高分布在低频段的打击型乐器(比如定音鼓)。

非常感谢~