Research
研究プロジェクト・論文・書籍等
- テクニカルレポート
[国内学会] リカレント構造を持つ複素制限ボルツマンマシンによる複素スペクトル系列モデリング
- #音声処理
- #音声合成
情報処理学会 第118回音楽情報科学・第120回音声言語情報処理合同研究発表会
識別器や特徴抽出など,様々な分野で広く用いられる制限ボルツマンマシン (restricted Boltzmann machine ; RBM) はバイナリ値または実数値の入力データを仮定していたが,音声信号処理では複素スペクトルなど複素数値データを取り扱う場合が多い.そこで我々の先行研究では,複素数データから直接潜在的な特徴量 (隠れ素子) を抽出する RBM の拡張モデル (Complex-valued RBM ; CRBM ; 複素 RBM) を提案した.本研究ではさらに,音声信号が時系列データであることに着目し,隠れ素子間の時間的な依存関係を考慮したモデル (Complex-valued temporal RBM ; CTRBM ;複素 TRBM) を新たに定義し,複素スペクトル系列モデリングの有効性を検証する.