急ピッチで進化する音声認識ソフトウェアの行く先は?

2014年02月23日 19:03

 富士通テン株式会社は、スマートフォン専用アプリケーションを用いて音声に応じて検索する「対話型音声認識カーナビ」英語版の試作機を開発したと発表した。スペインで毎年開催されている携帯電話関連の展示会「Mobile World Congress2014」に出展される予定。

 今回の試作機では下記を特徴としている。「定型語でなくても自然な話し言葉で認識する」「結果を音声で返す」「条件を追加しても文脈を理解して検索する(絞り込んでいける)」「音声で目的地が設定できる」。

 技術提供はイナゴ株式会社。独自のゴール共有型会話機能、文脈把握技術、自然言語理解技術等を搭載したスマートデジタルアシスタント技術「netpeople」により、ユーザーとの自然な対話を通して意図をくみ取り、積極的に質問をしながらユーザーが欲しい情報を絞り込んでいくアシストを行うという。

 音声認識によるアプリケーションが広く世に知られるようになったきっかけは、2011年にiOS向けに登場した秘書機能アプリケーションソフトウェア「Siri」の登場であろう。同様に、ドコモの「しゃべってコンシェル」、ヤフーの「音声アシスト」等あるが、いずれも音声でスマートフォンを操作することを目標としている。「頭が痛い」と言えばGPS機能により近隣の病院をリストアップし、「今日の予定は」と問えば、スケジュール機能を起動させる。

 ウェアラブル端末との相性もよい。米Nuance Communicationsが開発した、「Dragon Mobile Assistant」機能を搭載した「TrueSmart」は話しかけるだけで、メールやテキストメッセージなどの送信はもちろん、リマインダーの設定も可能だ。音楽が聞こえている状態で、「この曲は何?」と問いかけるとアーティストと曲名が知らされ、クラウド式の音楽サービスまで表示される。至れり尽くせりだ。

 手を使わず声で端末の操作が可能になれば、運転中はもちろんジョギング中や料理中など、様々なシーンでの用途が可能となる。しばらくは目が離せなさそうだ。(編集担当:堺不二子)