九州大学と東京工業大学、理化学研究所、スペインのバルセロナ・スーパーコンピューティング・センター、富士通<6702>による国際共同研究グループは、6月に公開された最新のビッグデータ処理(大規模グラフ解析)に関するスーパーコンピュータの国際的な性能ランキングであるGraph500において、スーパーコンピュータ「京(けい)」による解析結果で、2015年11月に続き3期連続(通算4期)で第1位を獲得したと発表した。
近年活発に行われるようになってきた実社会における複雑な現象の分析では、多くの場合、分析対象は大規模なグラフ(節と枝によるデータ間の関連性を示したもの)として表現され、それに対するコンピュータによる高速な解析(グラフ解析)が必要とされている。例えば、インターネット上のソーシャルサービスなどでは、「誰が誰とつながっているか」といった関連性のある大量のデータを解析するときにグラフ解析が使われる。
また、サイバーセキュリティや金融取引の安全性担保のような社会的課題に加えて、脳神経科学における神経機能の解析やタンパク質の相互作用分析などの科学分野においてもグラフ解析は用いられ、応用範囲が大きく広がっている。こうしたグラフ解析の性能を競うのが、2010年から開始されたスパコンランキング「Graph500」だ。
規則的な行列演算である連立一次方程式を解く計算速度(LINPACK(注2))でスーパーコンピュータを評価するTOP500においては、「京」は2011年(6月、11月)に第1位、その後、2016年6月20日に公表された最新のランキングでも第5位につけている。一方、Graph500ではグラフの幅優先探索(1秒間にグラフのたどった枝の数(Traversed Edges Per Second;TEPS)という複雑な計算を行う速度で評価されており、計算速度だけでなく、アルゴリズムやプログラムを含めた総合的な能力が求められる。
今回Graph500の測定に使われたのは、「京」が持つ88,128台のノードの内の82,944台で、約1兆個の頂点を持ち16兆個の枝から成るプロブレムスケールの大規模グラフに対する幅優先探索問題を0.45秒で解くことに成功した。ベンチマークのスコアは38,621GTEPS(ギガテップス)。
Graph500第1位獲得は、「京」が科学技術計算でよく使われる規則的な行列演算だけでなく、不規則な計算が大半を占めるグラフ解析においても高い能力を有していることを実証したものであり、幅広い分野のアプリケーションに対応できる「京」の汎用性の高さを示すものだという。
また、同時に、高いハードウェアの性能を最大限に活用できる研究チームの高度なソフトウェア技術を示すものと言える。「京」は、国際共同研究グループによる「ポストペタスケールシステムにおける超大規模グラフ最適化基盤プロジェクト」および「EBD:次世代の年ヨッタバイト処理に向けたエクストリームビッグデータの基盤技術」の2つの研究プロジェクトによってアルゴリズムおよびプログラムの開発が行われた。
2014年6月に17,977GTEPSの性能を達成し第1位、また「京」のシステム全体を効率良く利用可能にするアルゴリズムの改良が行われ2倍近く性能を向上させ、2015年7月に38,621GTEPSを達成し第1位だった。そして今回のランキングでもこの記録は神威太湖之光等の新しいシステムに比べても大幅に高いスコアであり、世界第1位を3期連続で獲得した。(編集担当:慶尾六郎)