modelscope/FunASR

是否有模型再分割两个说话人耦合的语句?

Opened this issue · 0 comments

VAD模型无法区分两个说话人连接很紧密的语音,这种分离有好的模型吗?