innnky/so-vits-svc

训练数据大概要多少,对长度要求吗?

Opened this issue · 2 comments

对音频了解不多,请问训练数据集大概需要多少,对长度要求吗?

一般大概需要2个小时左右的音频,并且每条在5到15秒之间。

总时长尽量大于半小时(如果实在提不出来数据集也请想办法尽量大于半小时)
每条的长度不宜过长或过短
最好输入较高音质的音频