基于Bark和Gradio Web UI 的文字转换语音和语音克隆工具
此工具是为了研究和学习目的开发的,它可能会以意想不到的方式偏离所提供的提示,对生成的任何输出不承担任何责任, 使用风险自负,请负责任地行事。
基于Bark的文字转语音功能, 支持特殊文字输入 ,支持多国语言提示库 Bark语言提示库
基于bark-voice-cloning-HuBERT-quantizer开发的工具进行克隆, 目前支持克隆语言 英语、日语、德语、国语训练中希望不会难产
名字 | HuBERT Model | Quantizer Version | Epoch | Language | Dataset |
---|---|---|---|---|---|
quantifier_V1_hubert_base_ls960_23.pth/en_tokenizer | hubbert | 1 | 23 | ENG | GitMylo/bark-semantic-training |
作者 | 姓名 | HuBERT Model | Quantizer Version | Epoch | Language | Dataset |
---|---|---|---|---|---|---|
junwchina | japanese-HuBERT-quantizer_24_epoch.pth/ja_tokenizer | HuBERT Base | 1 | 8 | JA | Hobis/bark-polish-semantic-wav-training |
C0untFloyd | german-HuBERT-quantizer_14_epoch.pth/pl_tokenizer | HuBERT Base | 1 | 14 | GER | CountFloyd/bark-german-semantic-wav-training |
克隆不同国家的语言需要不同国家对应的tokenizer.pth文件,比如要训练中文那么就需要一个对应中文的tokenizer.pth文件,需要对一门语言进行训练。
1.数据准备如图:
2.数据处理
3.开始训练
1.python环境 python>3.10
2.依次执行下列命令:
git clone https://github.com/douhaohaode/clone-voice.git
cd clone_vicoe
pip install .
pip install -r requirements.txt
python webui
此工程参考和使用了一些开源库和一些模型感谢他们的作者以及开源精神