東京大学情報基盤センター

スーパーコンピューティング研究部門

ホーム > スーパーコンピューティング研究部門 > 概要

概要

次世代のスーパーコンピュータの姿、科学技術計算の手法を研究し、日本の計算基盤の中核として大学・研究機関にスーパーコンピュータを提供しています。

「計算・データ・学習」の融合による
革新的スーパーコンピューティング

Society 5.0とは、デジタル技術によってコンピュータ上に形作られた仮想空間と現実空間を高度に融合させ、経済発展と社会的課題解決をともに実現する、人間中心の社会です。狩猟・農耕・工業・情報社会に続く新たな社会として提唱されました*1。これまでスーパーコンピュータは、主として計算科学・工学シミュレーションに使用されてきましたが、これにデータ科学、機械学習の手法を融合させることにより、Society 5.0のような新たな社会の実現が可能となります。

我々は、「計算・データ・学習(S+D+L)」融合を実現するスーパーコンピュータシステム(通称Big Data & Extreme Computing: BDEC)の構築を目指して、2015年頃からさまざまな研究開発を進めてきました。2021年5月に運用を開始した「Wisteria/BDEC-01」はBDEC構想に基づく最初のシステムで、国内最大級の規模を有しています。「富岳」と同じ汎用CPU(A64FX)を搭載したシミュレーションノード群(Odyssey)とGPUクラスタによるデータ・学習ノード群(Aquarius)で構成されています。シミュレーション向け、データ解析・機械学習向けの、異なるアーキテクチャを組み合わせたスーパーコンピュターシステムは、世界でも初めてです。Wisteria/BDEC-01は大容量の共有ファイルシステムとSSD搭載高速ファイルシステムを備えています。さらにAquariusの一部は大容量の通信回線で外部ネットワークに直接接続可能であり、SINETなどを介してセンサーネットワークからリアルタイムに観測データなどを取得することが可能です。

Wisteria/BDEC-01のような複合的システムにおいて、最大限の能力を引き出しつつ計算量・消費エネルギーを最小限に抑え、「計算・データ・学習」融合を実現するのが、革新的ソフトウェア基盤「h3-Open-BDEC」です。センター内外の計算科学、計算機科学、数値アルゴリズム、データ科学、機械学習の専門家が協力して開発しています。Wisteria/BDEC-01とh3-Open-BDECによって、観測データとシミュレーションを組み合わせたデータ同化、機械学習などによるシミュレーションモデルやパラメータの最適化などが、容易になります。実現象の解明に使用される非線形シミュレーションでは、パラメータを変えて何度も実行する必要がありますが、機械学習によるモデル・パラメータ最適化によって、実行回数を大幅に削減可能です。さらに変動精度演算を取り入れてシミュレーション時間の短縮を図り、従来と同等の正確さを保ちながら、大幅な計算量・消費エネルギー削減が達成可能です。我々は、h3-Open-BDECによる「計算・データ・学習」融合手法の普及を目指しています。

*1 Society 5.0: https://www8.cao.go.jp/cstp/society5_0/

Wisteria/BDEC-01の構成

Odyssey Aquarius
総理論演算性能 25.9 PFLOPS 7.2 PFLOPS
ノード数 7680 45(90 CPU,360 GPU)
総メモリバンド幅 8.38 PB/秒
ノード構成 Fujitsu A64FX x 1 Intel Xeon Platinum 8360Y× 2
NVIDIA A100 Tensor Core GPU× 8
共有ファイルシステム 25.8 PB
SSD搭載高速
ファイルシステム
1.0 PB