Research
研究プロジェクト・論文・書籍等
- 助成金
劣悪環境に頑健な声のデジタルクローン技術の確立とその応用
期間:2017年4月 – 2020年3月
助成種別:日本学術振興会 科学研究費助成事業 若手研究(A)
課題番号:17H04687
URL:https://kaken.nii.ac.jp/ja/grant/KAKENHI-PROJECT-17H04687/
話者適応は音声合成を応用した声のデジタルクローン技術である。本研究は音声合成用途以外の劣環境で収録された音声を対象とすべく、必要な要素技術を新たに提案し、データベースも構築した。まず低品質音声と元の高品質音声が対となったパラレルデータベースDR-VCTKを構築した。そしてテキストデータが付随しない音声信号からでも手軽に声のデジタルクローン出来るように、Multi-modal architectureという新たなニューラルネットを提案した。さらに劣環境下の音声を元に学習した話者エンコーダを組み込んだ新たなニューラルネットワークも提案し、教師なし話者適応を劣環境下の音声からでも行えることを示した。