🐶 tts和语音克隆gui工具

简介

基于Bark和Gradio Web UI 的文字转换语音和语音克隆工具

此工具是为了研究和学习目的开发的,它可能会以意想不到的方式偏离所提供的提示,对生成的任何输出不承担任何责任, 使用风险自负,请负责任地行事。

基于Bark的文字转语音功能, 支持特殊文字输入 ,支持多国语言提示库 Bark语言提示库

基于bark-voice-cloning-HuBERT-quantizer开发的工具进行克隆, 目前支持克隆语言英语、日语、德语、国语训练中希望不会难产

名字	HuBERT Model	Quantizer Version	Epoch	Language	Dataset
quantifier_V1_hubert_base_ls960_23.pth/en_tokenizer	hubbert	1	23	ENG	GitMylo/bark-semantic-training

作者	姓名	HuBERT Model	Quantizer Version	Epoch	Language	Dataset
junwchina	japanese-HuBERT-quantizer_24_epoch.pth/ja_tokenizer	HuBERT Base	1	8	JA	Hobis/bark-polish-semantic-wav-training
C0untFloyd	german-HuBERT-quantizer_14_epoch.pth/pl_tokenizer	HuBERT Base	1	14	GER	CountFloyd/bark-german-semantic-wav-training

克隆不同国家的语言需要不同国家对应的tokenizer.pth文件，比如要训练中文那么就需要一个对应中文的tokenizer.pth文件，需要对一门语言进行训练。

 1.数据准备如图:

 2.数据处理

 3.开始训练

1.python环境 python>3.10

2.依次执行下列命令：

git clone https://github.com/douhaohaode/clone-voice.git
cd clone_vicoe
pip install . 
pip install -r requirements.txt
python webui

此工程参考和使用了一些开源库和一些模型感谢他们的作者以及开源精神