/TTS-for-GPT-soVITS

这是一个简单的TTS后端项目 基于https://github.com/RVC-Boss/GPT-SoVITS 并提供了一些推理优化的特性/This is a simple TTS backend project based on https://github.com/RVC-Boss/GPT-SoVITS and provides some inference optimization features:

Primary LanguagePython

介绍

这是一个后端项目

基于https://github.com/RVC-Boss/GPT-SoVITS

对推理进行了特化,前后端分离,支持快速切换人物、模型管理等功能

可以实现快速切换人物

有关于更新

2024.2.26进行了大更新,请重新覆盖安装 并且,十分建议查看这个中文文档 https://www.yuque.com/xter/zibxlp/nqi871glgxfy717e

安装方式

对于安装

我们可以看看 https://www.yuque.com/xter/zibxlp/nqi871glgxfy717e

这个中文文档会更加详细

现在会更推荐直接以整合包的形式安装

导入模型

!注意,这个不同于主项目,而是将模型以人物卡的形式导入

在主项目的trained文件夹,通过子文件夹的形式导入人物

文件夹要求

文件夹名称就是人物名称

image.png

里面应该至少有3个文件

pth/ckpt/wav后缀名结尾

*如何指定默认角色

trained文件夹下有一个character_info.json 通过修改它可以改变默认角色

{
"deflaut_character":"hutao"
}

如何管理模型

我写了一个模型管理界面Character_Manager.py,可以通过bat启动

在里面可以方便的管理模型,添加情绪等

如何使用

直接双击bat即可 image.png

阅读3.0配置使用例

比如用阅读3.0

https://github.com/gedoor/legado

请直接看语雀文档:https://www.yuque.com/xter/zibxlp/uocryi6ryatwocu3

image.png

在朗读引擎中加入对应人名的朗读引擎

如图配置 image.png

http://192.168.0.106:5000/tts,
{
    "method": "POST",
    "body": {
        "cha_name": "hutao",
        "text": "{{java.encodeURI(speakText)}}"
    }
}

调整链接为你的挂载点

api

它默认运行在5000端口,挂载点是例如[http://192.168.0.106:5000/tts](http://192.168.0.106:5000/tts,)

接受的数据

最少项:

{
    "method": "POST",
    "body": {
       
        "text": "{{java.encodeURI(speakText)}}"
    }
}

详细选项

{
    "method": "POST",
    "body": {
        "cha_name": "hutao",
        "text": "{{java.encodeURI(speakText)}}",
        "top_k": 3,
        "top_p": 0.6,
        "temperature": 0.6
    }
}

其中text是必要项

cha_name可选,请确保在trained中存在对应模型,不指定则使用默认模型

其它参数如果不知道怎么指定,可以不指定

返回的数据

返回audio/wav