One-shot Voice Conversion by Separating Speaker and Content Representations with Instance Normalization
Opened this issue · 0 comments
supikiti commented
リンク
https://arxiv.org/pdf/1904.05742.pdf
どんなもの?
Instance normalizationを用いたone-host vcを提案
先行研究と比べてどこがすごい?
構造がINを用いたシンプルなものになっており、GANを用いるより学習が容易
技術と手法のキモはどこ?
- Instance Normalization : https://arxiv.org/pdf/1607.08022.pdf
- INを用いて入力された音声から効率よく話者性を排除(source speakerに対して)