通信設備を対象とした仮想化技術は途上段階にあり、特に障害対応作業が複雑化する懸念があった。一方、汎用サーバやオープンソース・ソフトなどの活用に伴い、通常の監視や診断では予測が困難なハードウエアの劣化やソフトウエアのバグなどが、運用自動化の盲点となりサービスに甚大な影響を引き起こす可能性が指摘されている。しかし、その様に極めて稀に発生する事象を如何に捉え、如何に適切に対応するか、技術が十分確立されておらず標準や実装も未整備な状況だ。
今回、KDDI研究所は、ウインドリバー、日本ヒューレット・パッカード、ブロケード・コミュニケーションズ・システムズと協力して、ネットワーク仮想化時代に向けて、人工知能を活用した自動運用システムを開発し、世界で初めて人工知能による故障予測に基づきネットワークを自動運用する実証に成功した。実証では、ソフトウエアバグなどの異常の兆候を9割以上の精度で事前に検知し、従来の約5倍の速度で仮想化された機能を別拠点などの安全な場所へ移行することに成功しているという。
実証実験は、共通的なネットワーク仮想化基盤に、ハードウエアやソフトウエアの深刻な障害の兆候を検知する人工知能を埋め込み、効率的に学習、状況判断すると共に、予兆結果に基づいてSDN/NFVオーケストレータが最適な復旧プランを導出し、仮想化された機能を瞬時に移行させる自動運用システムの実証に世界で初めて成功した。今回の成果は、設備警報などで検知可能な異常だけでなく、稀ながらも一旦発生すると深刻な事態を引き起こす恐れのある事象にも対応可能となり、ネットワーク仮想化時代の運用高度化の実現に向けた大きな一歩となるとしている。
実証実験の概要、ならびに、技術的ポイントは、3つ。まず、共通仮想化基盤に分散的に埋め込まれた人工知能が、汎用サーバや仮想化された機能など、ハードウエアとソフトウエアの両面で異常な兆候が無いか、学習、検知する。この結果、そのまま放置すると深刻な事態に繋がる恐れのある兆候を捉える。なお、精度の高い学習と分析には膨大な統計量の処理が必要になるため、人工知能を分散させるというアプローチを取っている。
この作業で捉えた兆候などの情報を、統合管理制御システムに集約。その情報に基づき、SDN/NFVオーケストレータは、最適な復旧プランを導出する。例えば、ソフトウエア異常を放置すると突然機能が停止する恐れがあり、停止する前に代替機能でサービスを継続させる。また、ハードウエア異常の影響を考慮して、該当する仮想化された機能を別拠点などへ移行させる。
そして、この復旧プランに基づき、実際の復旧作業を自動的に進める中で、特にハードウエアなどの設備に起因した異常に対しては、影響を受けるサービスの範囲が大きくなる。その様な場合、該当する仮想化された機能の数も非常に大きくなり、それらを如何にサービスに影響を与えずに移行させるかが課題となるという。そこで、高速移行技術で影響を最小限に留めながらリスクを回避するとしている。(編集担当:慶尾六郎)