Research

研究プロジェクト・論文・書籍等

Share

  • テクニカルレポート

[国内学会] 複素RBM:制限ボルツマンマシンの複素数拡張と音声信号への応用と評価

Author:中鹿 亘, 高木 信二, 山岸 順一

  • #音声処理
  • #音声合成

情報処理学会 第117回音声言語情報処理研究発表会

ディープニューラルネットワークの事前学習や特徴抽出器として,制限ボルツマンマシン (restricted Boltzmann machine ; RBM) がこれまで様々な分野で用いられてきたが,いずれのアプローチでも入力特徴量はバイナリまたは実数値が仮定されてきた.しかし,複素スペクトル,fMRI 画像,音響インテンシティなど,実データに基づいた画像認識や音声信号処理では複素数データを取り扱う場合が多い.本稿では,音声信号の複素スペクトルから直接潜在的な特徴量を抽出する,RBM の拡張モデル (complex-valued RBM ; CRBM ; 複素 RBM) を用いた音声信号モデリングの有効性を検証する.また,勾配法の一種である Adam を複素拡張した複素 Adam についても新たに提案し,その有効性を評価する.