Research
研究プロジェクト・論文・書籍等
- テクニカルレポート
[国内学会] CycleGANを用いたクロスリンガル声質変換
- #音声処理
- #音声合成
情報処理学会 第118回音楽情報科学・第120回音声言語情報処理合同研究発表会
CycleGAN は敵対的学習法を利用したニューラルネットワークにおいて,出力情報から入力情報を再現できるように一部の情報を保つ Cycle consistency 基準を加えたモデル構造であり,対にならないデータからでも異なるドメインへの変換関係を自動的に学習できるという特徴が知られている.この CycleGAN をノンパラレル声質変換に応用した場合,パラレル声質変換と同等もしくはそれ以上の話者性の変換が実現できることがわかっている.異なる言語対の音声データから声質変換モデルを学習する “クロスリンガル声質変換” は,このノンパラレル声質変換の特別なケースである.そこで,本研究では CycleGAN をクロスリンガル声質変換に利用し,その有効性を示す.