/visual_prosody

Primary LanguagePythonMIT LicenseMIT

visual_prosody

Ego4D_final_v2

pip install pyworld的时候安装最新版,就不会failed to build pyworld。

pip install g2p-en inflect librosa matplotlib numba numpy pyworld PyYAML scikit-learn scipy soundfile tensorboard tgt tqdm unidecode pandas
python prepare_align.py config/Ego4D_final_v4/0421preprocess.yaml

得到的结果在./raw_data/Ego4D_final_v3.

python preprocess.py config/Ego4D_final_v4/0421preprocess.yaml
unzip -q /content/visual_prosody/hifigan/generator_universal.pth.tar.zip -d /content/visual_prosody/hifigan/
unzip -q ./hifigan/generator_LJSpeech.pth.tar.zip -d ./hifigan/  
python train.py -p config/Ego4D_final_v4/0421preprocess.yaml -m config/Ego4D_final_v4/0421model.yaml -t config/Ego4D_final_v4/0421train.yaml
cp -r /data/acp22yc/WORK/visual_prosody_22050hz/visual_prosody/output/0423a/log/ /data/acp22yc/WORK/temp_log/0423/
tensorboard --logdir .\temp_log\0423\log\Ego4D_final_v4\

tensorboard --logdir .\output\0421a\log\Ego4D_final_v4\