


多目的ホール、駅構内、空港などの広い空間で音声が電気的に拡声される際、室内のスピーカから放射された音声には同時に長い残響が掛かることになる。このような残響環境下ではしばしば音声の聞きとりが低下するが、特に聴覚障害者・高齢者・非母語話者ではその影響は大きい。残響によって音声明瞭度が減少する原因として、先行音に付加された残響の尾が後続音をマスクする overlap-masking(Nabelek et al., 1989)があげられる。先行音が母音のようなエネルギの強い音素の場合、後続の音素は残響が付加された先行音による影響を大きく受けることが指摘されている(Arai et al., 2001, 2002)。図1の原音声と残響が付加された音声を比べると、音声波形の包絡が残響によってぼやけてしまっているのが分かる。






1. 原音声 () と原音声に残響が付加された音声 ()






2. 音声のバリアフリーを提供するためのアプローチ


前処理側として私たちはこれまで、変調フィルタリングを用いた処理(例:Kusumoto et al., 1999, 2000, 2005)や、定常部抑圧処理(例:Arai et al., 2001, 2002; Hodoshima et al., 2006)を提案してきた。変調フィルタリングは、音声知覚に重要であるといわれている変調スペクトル(音声の時間変化に対するスペクトル)の低周波数領域(例:16Hz以下)(Houtgast and Steeneken, 1985)を強調する処理である。

定常部抑圧処理は、図3のように母音のようなエネルギの大きい音声の定常部を抑圧することでoverlap-masking を効果的に減少させる技術であるが、これは定常部の情報は遷移部の情報に比べて比較的冗長である(Furui, 1986)という点に着目しており、音声明瞭度を極力低下させずにoverlap-maskingの影響を軽減することができる。


aka_woax sss20_aka_woax




     図3. 単語/aka/の原音声()と原音声に定常部抑圧処理を施した音声()


 発話者側からのアプローチでは、残響にロバストな音声を調査している。音声明瞭度は話者によって変化するだけではなく、同一話者であっても話し方(例:はっきりした、会話調)や発話速度(例:ゆっくり、通常、速い)によっても変化する。私たちは残響下で明瞭な音声信号の特徴や、明瞭な発話・遅い発話速度の影響を調査している(例:Hodoshima et al., 2007)







1) 拡声システム側

- 変調フィルタリングは残響下で若年健聴者の子音明瞭度を改善した (Kusumoto et al., 2005)

- 重度の聴覚障害者は変調フィルタリング処理を行った音声の方が、処理をしていない音声よりも残響下で聞きやすいと判定した (Kusumoto et al., 1999, 2000)

- 定常部抑圧処理は、次の条件において残響下で子音明瞭度を有意に改善した (例:Arai et al., 2007; Hodoshima et al., 2005, 2006, 2008a; Miyauchi et al., 2005; Nakata et al., 2006)

- 模擬残響環境下と講堂(残響時間0.7-1.3 s

- 若年健聴者と高齢者

- 通常と遅い発話速度

2) 発話者側 (Hodoshima et al., 2007, 2008b)

- 残響下を想定して発話してもらった音声を若年者が聞き、話し方に対する聴覚印象によって「はっきり」と「会話調」とに音声を分類した場合、「はっきり」に分類された音声の正解率の方が高かった。




私たちの研究を通じて、高齢者・聴覚障害者・非母語話者のための音声のバリアフリーの実現や、より高性能な補聴器の設計(例:小林ら, 2008)などに貢献するものと期待される。







