supikiti/Awesome-tts-and-vc

One-shot Voice Conversion by Separating Speaker and Content Representations with Instance Normalization

Opened this issue · 0 comments

リンク

https://arxiv.org/pdf/1904.05742.pdf

どんなもの?

Instance normalizationを用いたone-host vcを提案

先行研究と比べてどこがすごい?

構造がINを用いたシンプルなものになっており、GANを用いるより学習が容易

技術と手法のキモはどこ?

どうやって有効だと検証した?

議論はある?

次に読むべき論文