/GPT-SoVITS-Server

【脱离复杂的环境配置和整合包,极简配置推理服务】从GPT-SoVITS项目里面提取出来的,纯粹的推理服务方案。

Primary LanguagePythonGNU General Public License v3.0GPL-3.0

GPT-SoVITS-Server

我在一台realme手机上运行了这个项目!

如果是ubuntu上进行推理的话,你也可以看这里

这个项目的意义在于,如果你是一个应用者,可以完全舍弃源项目! 不需要复杂的环境搭建,不需要下载特别庞大的整合包,只需要这个几M的小项目,把训练好的模型用起来即可。 我在一台手机上尝试完成的服务器的部署,这个最能说明问题。

下面的废话基本没有必要看


GPT-SoVITS项目是一个目前为止最优秀的语音克隆项目。 很多朋友使用云端的模型训练工具完成声音克隆的模型训练,推理合成的时候,其实不需要把完整的项目都克隆到本地,其实只需要从云端下载好模型文件,然后丢在本地或者服务器上即可。 训练模型对于算力要求很高,但是推理合成其实可以用CPU也行——绝大多数的服务器其实都是CPU计算,GPU服务器太贵了。

自身也懒得在很复杂的文件体系中做配置,索性从源项目提取出来了这个项目,核心内容在server.py里面,大家可以修改里面的配置,然后使用即可。

这个版本删除了日语和英语,纯粹的中文。

系统环境:

依赖

pretrained_models下载地址:https://huggingface.co/lj1995/GPT-SoVITS/tree/main 把:chinese-hubert-base ,chinese-roberta-wwm-ext-large下载后丢到本地,记得修改server.py里面的路径即可。

windows

  • 我在本地使用的是源项目提供的windows的runtime运行时环境,所以已经装好了依赖,如果有使用相同环境的,直接使用../runtime/python.exe ./server.py即可。
  • 切记下载ffmpeg.exe放在server.py同级目录;本项目已包含,linux下不需要,删除该文件即可
  • server.py里面clean_path函数一定要看注释,修改一下;

云服务器 或者 自己的安卓手机

看文章开始的提示,直接看这里

优化方向

  • 代码的结构重新规整
  • 把原来项目中的日语、英语部分重新融合进来
  • 代码规范化实现
  • 对Windows和Linux的兼容性代码做优化
  • 优化代码的运行速度
  • 把Windows部分的运行时完整提取出来,后期可以考虑用GUI进行一下封装
  • 封装一个docker

做好Windows的GUI和云服务器的部署之后,大家可以在云端训练模型,完了用CPU在云端或者本地电脑进行推理,而不需要再去仔细琢磨完整的项目,对新手或者是应用型选手更加友好便捷。