国勢調査は国民の現状を把握するうえで欠かせないものだが、莫大な費用がかかるうえに、調査に時間が要することから統計結果が出たころにはデータが古くなっていることもある。こうした国勢調査の課題を解決する新しい統計調査手法が研究されている。スタンフォード大学の研究チームは、Googleストリートビューの画像から、米国の大小さまざまな都市の人口動態を正確に予測できたと発表した。
米国200都市で撮影された計5000万枚にもおよぶGoogleストリートビュー画像から、映り込んでいる自動車のメーカーやモデル、年式などを抽出し地域ごとにデータ化、各地域の人種や収入、教育レベル、職業等との関連づけを行った。合計約2200万台の自動車を、特徴の組み合わせによって2657パターンに分類。作業は1台あたり約0.2秒で、完了までに2週間を要した。人間が同じ作業を1台10秒で行うとすれば15年以上の作業となるとのこと。
次の段階として、同研究チームは導き出された車両パターンから人口動態を予測するアルゴルズムを開発。このためには、米国35都市の自動車分類データと米国国勢調査局のデータ、各投票地区での大統領選投票パターンを使って深層学習を実施した。その後検証により、開発したアルゴリズムが、車両パターンからその地域の住民の収入や教育、職業等の人口動態統計・社会経済的属性から政治的選好までを高精度で予測できることを確認した。
同統計調査手法を活用することで、刻一刻と変化する地域ごとの人口動態・政治的選好をごく短期間に取得できる可能性がある。米国での実証により確立された同統計調査手法の応用により、世界のさまざまな都市で適用可能なモデルの構築が期待される。モデル構築の実現により、日本では現在5年に一度となっている国勢調査に関しても、よりきめ細やかな期間での人口動態取得が可能となる。また、人口変動や労働力状態のみならず、社会経済的属性や政治的選好などの追加情報の把握も期待できることから、国勢調査の補助的な統計調査としての実用化が期待される。(編集担当:久保田雄城)