supikiti/Awesome-tts-and-vc

One-shot Voice Conversion by Separating Speaker and Content Representations with Instance Normalization

Opened this issue 4 years ago · 0 comments

supikiti commented 4 years ago

リンク

https://arxiv.org/pdf/1904.05742.pdf

どんなもの？

Instance normalizationを用いたone-host vcを提案

先行研究と比べてどこがすごい？

構造がINを用いたシンプルなものになっており、GANを用いるより学習が容易

技術と手法のキモはどこ？

Instance Normalization : https://arxiv.org/pdf/1607.08022.pdf
INを用いて入力された音声から効率よく話者性を排除(source speakerに対して)

どうやって有効だと検証した？

議論はある？

次に読むべき論文