人間関係は難しい、職場はもちろん、親子や親族でさえ、その難しさやわずらわしさに苦しむことが多い。いっそのこと、ロボットと一緒に暮らしたほうがマシと思うことさえある。
しかし、やはり会話がないとツライ。このため、ロボットと人との自由な対話は最も重要な技術と認識されており、多くの研究開発が行なわれている。しかし、自由な対話のためには音声認識、内容の理解と回答の作成、音声発話の技術が必要だ。
こういった研究は進んでおり、近年では、携帯電話などで人が話した質問から話題を推定し、話題に対応した回答をする機能が実用化されている。しかし、ロボットは、離れた距離で、かつ、直接操作をすることなく会話の口調で対話を行うため、独自の技術開発が必要なのだ。
今回、日立製作所<6501>は20日、質問に含まれる対象と属性から最適な回答を選んで説明し、うなずいたり、首をかしげる動作から相手の理解度を推定して、より自然な回答をする人間共生ロボット「EMIEW2」の対話技術を開発したと発表した。
日立では、2005年に開発した「EMIEW」以来、人間と共生するロボット技術を開発している。07年に発表した「EMIEW2」は、人の早足とほぼ同じ時速6kmで2輪の自律走行を行い、屋内の段差を乗り越えたり、危険を予知して回避するなどの運動機能や、14本のマイクによって雑音の中でも人の声を聞きわけたり、web情報から物体を認識しネットワークカメラで探し出し案内するなどの知的活動が可能だ。
今回、ロボティクスの対話機能を進化させる2つの技術を開発し「EMIEW2」に搭載した。一つ目は、事前に用意した質問文から、対象とその属性を認識するのに必要な単語の並びを学習し、データベースに記録・蓄積する。質問を受けたときに、音声認識により単語列を取得し、データベースと比較して、対象と属性を認識する技術を開発した。
この技術により、知りたい対象とその属性に最適な回答を選別する。今回、学習方法に、認識の分野で注目されているDeep Learningを使用することで、高い性能で認識可能になった。
二つ目の技術は、 うなずいたり、首をかしげる動作から相手の理解度を推定する技術。これは、事前に、「EMIEW2」と人の対話映像を分析して反応に伴った動きを学習する。実際の対話では、「EMIEW2」の回答を聞いている相手を内蔵のカメラで撮影し、撮影された映像から相手がうなずいたり、首をかしげたりする動作を識別する。
「EIMEW2」の回答に対して推測される相手の反応と比較して、質問者の理解度合いを推定する技術を開発しました。回答の中身に沿って質問者の理解度合いを知る、より人間的な対話が可能となった。
今回この開発した2つの技術を「EMIEW2」に搭載することで、会話口調での質問から、対象とその属性を認識し最適な回答を行い、さらに相手の反応を見て適切に対応できるようになった。これにより、ロボットと人との対話をより円滑になったという。
SF映画などにはよくロボットの執事などがでてくるが、案外近いうちに実現するかもしれない。人間はわずらわしいが、ロボットは従順なのだ。また、可愛らしい外見に作製し「死なないペット」としての需要も出てくるかもしれない。(編集担当:慶尾六郎)