User Profile:
国立研究開発法人海洋研究開発機構(JAMSTEC)は、日本の海洋科学技術の中核的研究開発推進機関として、海洋及び地球科学に関する研究開発(主に地球環境の状況把握・変動予測・海洋資源の持続的有効利用・地震及び火山活動など)を行っています。
中でも地球情報基盤センター・計算機システム技術運用グループでは、「地球シミュレータ」をはじめとするスーパーコンピュータの運用・管理を行うとともに、利用に関する様々な技術支援や研究開発を行っています。
JAMSTECは2021年3月1日より第4世代の「地球シミュレータ」(ES4)の運用を開始しています。ES4は自然現象などの大規模計算に向いたNECのベクトル型計算機、スカラ型計算機、GPUを組み合わせた、汎用性の高いマルチアーキテクチャ構成のスーパーコンピュータです。大規模シミュレーションやデータ解析、AIなどの幅広い用途に対応します。
ES4は総理論演算性能、総ストレージ容量ともに第3世代(ES3)の十数倍の規模となっており、試行回数の増加や範囲の細分化が可能になりました。台風の卵の発見など、自然現象の予測研究が大きく加速することが期待されます。
ES4の運用において、演算能力はもちろんのこと、エネルギー効率も重要な指標です。スーパーコンピュータの消費電力は、実行する計算プログラムによっても変わります。そのため、実際の消費電力量を計測する必要がありますが、分電盤の使用回路数が多いため、全体を把握するのは容易ではありません。またスーパーコンピュータは計算機だけが全てではありません。ストレージやネットワークはもちろん、冷却設備を含めたスーパーコンピュータを維持する施設全体における消費電力量を把握し、効率良く運用していく必要があるのです。
iDCNaviの導入前も、簡易的なアプリケーションを使用して電力監視を行っていましたが、機器が多様化するにつれて段々と取り組みたいことが増えてきました。そこで、大規模なデータセンターの電力監視システムとして実績があり、柔軟なカスタマイズ性、直観的なユーザインタフェースを有するiDCNaviを導入することになりました。
iDCNaviの導入により、ES4を構成する機器の消費電力をリアルタイムに監視、集計することが可能になりました。ラック単位だけでなく、計算機やストレージといったサブシステム単位の消費電力、さらにはCPUを冷却する水冷設備の詳細データも含めて一括管理できるようになり、運用性が向上しています。
特にマシンルームのフロアのラックレイアウトから、ラック単位の消費電力を表示できる作りは、直観的で分かりやすく助かっています。
ES4では水冷設備の水温・流量・冷却熱量の計測・監視もiDCNaviで実現しています。水冷設備の運用監視だけでなく、全発熱量に対する水冷割合の把握や、冷却水の往きと還りの温度データの蓄積ができています。
ES4はマルチアーキテクチャであるため、様々なメーカーの機器を、NECがインテグレーションしています。電力量の計測値を出力するゲートウェイやPDUも、3社の製品を採用しています。製品ごとにインターフェースが異なるのですが、iDCNavi上で計測データを一元管理できるように設計、構築してもらいました。iDCNaviがインターフェースの違いを吸収してくれるので、ひとつのシステムとして容易に運用できています。
日本ノーベルとは設計フェーズからデータの見え方やレポートの出し方などを相談できたのがありがたかったです。思った通りの集計や表示ができるかを、デモ画面を見ながら何度も質問しました。エンジニアの応答が非常に誠実であり、会話の中ですぐに具体的な実現方法を提示してくれて、私たちに寄り添って一緒に形にしていく姿勢に、頼もしさを感じました。
今後はiDCNaviで蓄積したデータを分析し、省エネ運用にも繋げていきたいです。消費電力の推移を高精度に予測したり、計算ジョブ毎の消費電力を把握することが可能になるのではと期待しています。またES4のマルチアーキテクチャを、最適に利用するための指標にもできればと思います。
せっかく集めた実働データは大変貴重ですから、分析して有効に使っていきたいと思います。