iiguni.png(18697 byte)
home.png(7272 byte)
大阪大学 大学院基礎工学研究科
システム創成専攻 システム科学領域
システム理論講座 飯國研究室
   ホーム    研究概要        研究室メンバー      研究業績                                                   
   音声処理    画像処理        信号システム解析      DSP実現                                                   

1.信号源のモデルに基づくスパース信号分解と単一チャネル音声分離問題への応用

SPD.png(64907 byte)

混合された音から,個々の音源を分離する問題は,音源分離問題と呼ばれ,音声認識,音楽の解析等,多くの応用が期待されている. 多くの音源分離法では,複数のマイクロホンを用い,音源の位置の違いによって分離を達成している. それに対して,飯國研究室では,単一のマイクロホンのみを用いた複数話者の音声分離,雑音除去等の検討を行っている. 音源分離のために,混合されている波形のモデルを作り,そのモデルが混合中に"まばらに"存在することを仮定することで信号分解を行うアルゴリズム:スパース周期信号分解法を提案した. スパース周期信号分解により,混合音声は,わずかな数の周期信号群へと分解される. 分解結果にクラスタリングを適用し,さらにクラスタを話者情報をもとに話者へ振り分けることで音声分離を達成している.

音声分離例


2.可変音声分布に基づく雑音除去

マイクロホンを使用して音声を収録すると,音声とともに周囲の雑音も収録されます.雑音と音声が混在する信号から,音声だけを抽出する技術は重要な研究課題であり,電話機や音声認識装置への応用が期待されています.本研究室では,音声の出現確率を表す確率分布を利用して,音声を抽出する方法について研究しています.従来の類似研究では,音声の確率分布をあるひとつの分布関数で仮定していました.しかし,実際の音声信号を観察しますと,声を発している時間(発話区間)と,声を止めている時間(休止区間)があることがわかります.我々は,これらの全く特徴の異なる区間を同一の分布関数で扱うべきではないと考え,発話区間と休止区間はもちろんのこと,音声の大きさに応じて分布関数を変化させる方法を提案しています.

雑音除去結果の音声

3.適応ノイズサプレッサ

電話機の快適な通話環境を確保するため,劣悪な雑音環境下においても有効かつリアルタイム動作可能なノイズサプレッサの実現が望まれています. しかし,最近提案された優れた雑音除去法の多くは,根号や特殊関数の演算を必要としており,洗練されたプログラミング技術を用いなければリアルタイムで動作させることは困難です. そこで我々は,演算量の少ない適応フィルタを用いてノイズサプレッサを実現する方法について研究しています. 提案する適応アルゴリズムによれば,適応フィルタ出力の自己相関関数を,雑音の自己相関関数に近づけることができ,両者が近づくほど雑音除去効果が高くなります. また,音声と雑音の自己相関関数が異なっているほど,音質劣化は小さくなります.


提案アルゴリズムの演算量は,一般的な時間更新アルゴリズムと全く同じであり,DSPを用いたリアルタイム処理が可能です. 演算量は少ないですが,劣悪な雑音環境下を想定したシミュレーション結果からも提案法の有効性が確認できます.

雑音除去結果の音声

Copyright (C) 2008 Iiguni Lab. Osaka Univ. All Rights Reserved. mesi.png(1010 byte)