Interviews & Lectures
取材・講演
- 講演実績
音声研究会
[招待講演]EMAデータを利用した統計的音声合成における調音制御
- #音声処理
- #音声合成
- #信号処理
講演者:山岸順一
会議名:2016年1月度 電子情報通信学会 音声研究会(SP)
主催者:電子情報通信学会
開催地:神奈川
開催日:2016年1月14日
URL:https://ken.ieice.org/ken/paper/20160114hb5k/
本論文では、Electro-Magnetic Articulograph (EMA) 等により取得された、舌・唇等の調音器官の発話中の位置情報 “調音運動” と、対応する音声波形信号や言語情報とを同時に利用した統計的音声合成システムについて紹介する。統計的音声合成方式は、非常に明瞭性の高い音声を生成可能であること、モデルパラメータを変化させることで多様な音声を合成可能であることが利点として知られているが、その一方で、音声波形信号のみから音響モデルの学習を行っていることから、音声生成メカニズム、特に調音位置や調音運動に関する情報・知見を十分に活用することは容易ではなかった。そこで我々は、EMA データといった調音器官の計測データを音響モデルの一部として利用し、調音特徴量を操作することで、スペクトルなどの音響特徴量を操作した場合よりも直感的な制御が可能になることを示してきた。本稿ではこれらの概要及び一部の実験結果を示す。