/I_am_a_person

实时互动的GPT数字人

Primary LanguagePythonApache License 2.0Apache-2.0

I_am_a_person

实时互动GPT数字人

一. 数字人形象生成与定制

  1. 人体姿态估计和渲染
  2. 数字人动作与换装换衣试穿.md
  3. 视频生成.md
  4. 换脸
  5. AI换脸系列
  6. https://github.com/modelscope/facechain.git
  7. https://github.com/ZHKKKe/MODNet
  8. AI绘图(stableDiffusion)
  9. 人脸人体检测分割

二. 数字人输入--语音识别

  1. AI语音-01-概述
  2. k2语音识别.md
  3. whisper
  4. funasr+Paraformer:https://github.com/modelscope/FunASR
  5. SenseVoice:https://github.com/FunAudioLLM/SenseVoice

三. 数字人大脑--大语言模型

  1. 角色扮演模型
  2. 小模型
    • miniCPM
    • MiniCPM-V
    • Phi-3-v
    • gemna2b

四. 数字人讲话唱歌--语音合成

  1. tts
  2. 唱歌tts(singing voice conversion):
    • so-vits-svc
    • NeuCoSVC
  3. 聊天tts
  4. 其他

五. 数字人驱动

  1. 真人数字人项目
  2. 数字人-01-方案概述
  3. 虚拟数字人
  4. 三维重建数字人
  5. 动捕

七. 其他

  1. 参考项目