/VirtualDigitalPerson

Primary LanguageRoffApache License 2.0Apache-2.0

VirtualDigitalPerson

迅速克隆一个声音外貌相同的虚拟数字人。

1.声音克隆

1)下载预训练模型声音模型fastspeech2_mix_ckpt_1.2.0和声码器模型hifigan_aishell3_ckpt_0.2.0放到pretrained_models文件夹下
https://paddlespeech.bj.bcebos.com/t2s/chinse_english_mixed/models/fastspeech2_mix_ckpt_1.2.0.zip
https://paddlespeech.bj.bcebos.com/Parakeet/released_models/hifigan/hifigan_aishell3_ckpt_0.2.0.zip

2)

3)将视频放到data\speaker\input_video文件夹下

4)运行run_preprocess.sh,生成训练数据

5)运行run_mix.sh 进行声音合成,test_sentencecs.txt中为输入文字,合成音频会放在test_e2e文件夹下

参考项目:
https://github.com/PaddlePaddle/PaddleSpeech
https://github.com/jerryuhoo/VTuberTalk

2.虚拟人生成

1)将人物动作视频放到data\action_video文件夹下

2)打开gereral_demo.py,在--human参数中填写刚才放入的视频路径,在--text参数中输入要虚拟人物说的文字

3)运行gereral_demo.py,生成视频将存放在gen_video文件夹下