/SpeechSynthesis

음성합성 관련 자료 모음

Apache License 2.0Apache-2.0

Text-to-Speech Synthesis

딥러닝을 이용한 음성합성 관련 자료 모음

Lectures & Seminars

Dataset

  • CMU_ARCTIC (en)
    • CMU의 Language Technologies Institute에서 음성합성 연구를 위해 만든 US English 데이터셋
  • The LJ Speech Dataset (en)
    • Keith Ito란 사람의 웹사이트에 올라와 있지만 어디서, 왜 만들었는지에 대한 내용은 찾지 못함
  • Blizzard 2012 (en)
    • Blizzard Challenge 2012라는 코퍼스기반 음성합성 챌린지에서 사용된 데이터셋
  • CSTR VCTK Corpus (en)
    • English Multi-speaker Corpus for CSTR Voice Cloning Toolkit

한국어 코퍼스

WaveNet

Paper

Articles

Source Code

Multi-GPU

WaveNet 학습시간이 너무 오래 걸려서 멀티 GPU를 이용하지 않으면 답이 나오지 않는 것 같다. 그와 관련된 코드 링크를 정리하였다.

Fast WaveNet

Paper

Articles

Source Code

Parallel WaveNet

Paper

Articles

Source Code

WaveRNN

Paper

Deep Voice

Paper

Deep Voice 2

Paper

Deep Voice 3

Paper

Source Code

Tacotron

Paper

Source Code

Tacotron 2

Paper

Articles

Source Code