新しい物事を学ぶとき、我々は既に学習した情報を再生(リプレイ)し、組み合わせて学習のための戦略を考える。学習済みの知識をリプレイし、あらかじめイメージトレーニングをしてから戦略的に物事を進める方が既存の知識を上手く活用できることは多くの者が経験的に知っていることではないだろうか。イメージトレーニングはスポーツや芸術など多くの分野で学習を効率的に進めてゆくために有効な手段として認められている。しかし、その脳生理学的な根拠は十分に解明されていなかった。
この効率的な学習の脳生理学的な根拠を東大の研究グループが発見した。東京大学大学院薬学系研究科博士課程の井形秀吉大学院生(研究当時)、佐々木拓哉特任准教授、池谷裕二教授の研究グループが、報酬を得るための行動戦略を効率的に学習するために、海馬の神経細胞による情報再生(リプレイ)が重要であることを解明したと12月22日に発表した。
我々の脳は、適切な行動戦略を新しく学習する際、期待される報酬や労力を適切に評価する必要がある。このためには物事に優先順位を付けて学習・記憶するような脳の情報処理メカニズムが存在するはずだ。このアルゴリズムは生物の脳だけで重要なわけではなく、コンピュータによる機械学習でも同様と考えられており、機械学習を効率化・高速化する計算アルゴリズムの一つとして注目されている。
研究グループは、こうした情報処理を実行する脳の部位として海馬に着目し、ラットに迷路課題を解かせて、報酬を得るために新しい行動戦略を学習する時に海馬の神経細胞群の活動および情報再生がどのように変化するかを観察した。実験の結果、動物が学習を進めるにつれて海馬の神経回路が効率的な情報表現を形成し、学習に重要なエピソードをより頻繁にリプレイすることを発見した。
注目すべきは、ラットが最も効率的な行動戦略を実行する前から脳内では行動戦略のリプレイが始まっていたという点だ。これは、海馬の神経回路が学習した出来事や行動戦略に優先順位を付けてリプレイする能力を持っていることを意味する。
この研究成果は単に生物の脳における戦略構築や効率的学習に関する解剖学的な根拠を明らかにしただけで無く、AIなどの機械学習をより効率的にするアルゴリズムの研究に応用されるものだ。(編集担当:久保田雄城)