日立がテレビ会議システムの残響低減技術を開発

2012年03月15日 11:00

 日立が室内の天井や壁、設備などに反射して生じる残響を大幅に低減できる音声処理技術を開発したと発表。アレイ型マイク一台とPCを会議室に設置するだけで、発話者の場所や顔の向きが時々刻々と変化した場合でも残響を除去、聞き取りやすい音質でコミュニケーションができるテレビ会議システムを実現する。最大20名程度が参加可能な約50m2の会議室での実証実験では、残響を9分の1に低減できることを確認したという。

 従来の技術では、残響がマイクに到達する時間と音量(残響のパターン)が一定であるとの仮定に基づいて残響成分を推定し除去いていたものの、実際には発話者の位置や顔の向きが少しでも変化すると残響のパターンは変動するため、残響を高精度に除去することが難しいという課題があった。

 今回開発された技術では、音声がどちらの方向から到達したかを推定することができるアレイ型マイクを用いて収録。過去約5秒間の音声に対して、直接届いた音声と、異なる方向から遅れて届く残響音の分離処理を行う。さらに、その分離された残響音から、残響音声の到達時間や音量がどのくらい変動するのかを求め、この変動量も考慮した残響の発生パターンを推定するという。そして、推定された残響発生パターンに基づき、入力された音声に対して、残響成分の音量を推定し、聞きたい音声の音量とのバランスを考慮した残響成分高精度な除去をリアルタイムで行うという。

 近年、企業のグローバル展開が進む中、出張費や移動経費などのコスト低減や業務の効率化のために、遠隔拠点間のコミュニケーションツールとしてテレビ会議システムの導入が本格化。シードプランニングによると、映像・音声会議システムの市場は、2010年の329億円から2014年570億円に、2020年には2000億円になると予想されている。さらに、クラウドコンピューティング、タブレット端末、スマートフォンのビデオチャットが普及し、従来の会議用途以外に業務支援や業務そのものに映像コミュニケーションが活用されることになると、それら映像コミュニケーション市場の6000億円が加わり、8000億円の規模になるという。今回開発された技術は、会議室におけるテレビ会議システムの通話品質の向上だけでなく、室内で動作する対話ロボットの音声認識精度の向上にも寄与する技術となる。これらの業界を刺激し、他の市場も連鎖的に拡大させることができるであろうか。その普及の動向に注目が集まるところであろう。