導入事例: 国立研究開発法人 海洋研究開発機構(JAMSTEC)様

電力の可視化で「地球シミュレータ」運用性向上データをもとに次の省エネへ繋げる

システム全体だけでなく、ラック単位、サブシステム単位の消費電力を見える化

User Profile:

国立研究開発法人海洋研究開発機構(JAMSTEC)は、日本の海洋科学技術の中核的研究開発推進機関として、海洋及び地球科学に関する研究開発(主に地球環境の状況把握・変動予測・海洋資源の持続的有効利用・地震及び火山活動など)を行っています。

中でも地球情報基盤センター・計算機システム技術運用グループでは、「地球シミュレータ」をはじめとするスーパーコンピュータの運用・管理を行うとともに、利用に関する様々な技術支援や研究開発を行っています。

汎用性が高まった第4世代「地球シミュレータ」

JAMSTECは2021年3月1日より第4世代の「地球シミュレータ」(ES4)の運用を開始しています。ES4は自然現象などの大規模計算に向いたNECのベクトル型計算機、スカラ型計算機、GPUを組み合わせた、汎用性の高いマルチアーキテクチャ構成のスーパーコンピュータです。大規模シミュレーションやデータ解析、AIなどの幅広い用途に対応します。

ES4は総理論演算性能、総ストレージ容量ともに第3世代(ES3)の十数倍の規模となっており、試行回数の増加や範囲の細分化が可能になりました。台風の卵の発見など、自然現象の予測研究が大きく加速することが期待されます。

演算性能だけでなく、省エネも追及

ES4の運用において、演算能力はもちろんのこと、エネルギー効率も重要な指標です。スーパーコンピュータの消費電力は、実行する計算プログラムによっても変わります。そのため、実際の消費電力量を計測する必要がありますが、分電盤の使用回路数が多いため、全体を把握するのは容易ではありません。またスーパーコンピュータは計算機だけが全てではありません。ストレージやネットワークはもちろん、冷却設備を含めたスーパーコンピュータを維持する施設全体における消費電力量を把握し、効率良く運用していく必要があるのです。

iDCNaviの導入前も、簡易的なアプリケーションを使用して電力監視を行っていましたが、機器が多様化するにつれて段々と取り組みたいことが増えてきました。そこで、大規模なデータセンターの電力監視システムとして実績があり、柔軟なカスタマイズ性、直観的なユーザインタフェースを有するiDCNaviを導入することになりました。

iDCNaviでラック単位や特定範囲の消費電力が計測可能に

iDCNaviの導入により、ES4を構成する機器の消費電力をリアルタイムに監視、集計することが可能になりました。ラック単位だけでなく、計算機やストレージといったサブシステム単位の消費電力、さらにはCPUを冷却する水冷設備の詳細データも含めて一括管理できるようになり、運用性が向上しています。

特にマシンルームのフロアのラックレイアウトから、ラック単位の消費電力を表示できる作りは、直観的で分かりやすく助かっています。

ES4では水冷設備の水温・流量・冷却熱量の計測・監視もiDCNaviで実現しています。水冷設備の運用監視だけでなく、全発熱量に対する水冷割合の把握や、冷却水の往きと還りの温度データの蓄積ができています。

iDCNaviのグラフィック監視画面

フロアマップからラックを選択し、電力量などの計測値を表示できます。
(導入されたものとレイアウトなどは異なります)

ハードウェアの違いを吸収し一元管理

ES4はマルチアーキテクチャであるため、様々なメーカーの機器を、NECがインテグレーションしています。電力量の計測値を出力するゲートウェイやPDUも、3社の製品を採用しています。製品ごとにインターフェースが異なるのですが、iDCNavi上で計測データを一元管理できるように設計、構築してもらいました。iDCNaviがインターフェースの違いを吸収してくれるので、ひとつのシステムとして容易に運用できています。

日本ノーベルとは設計フェーズからデータの見え方やレポートの出し方などを相談できたのがありがたかったです。思った通りの集計や表示ができるかを、デモ画面を見ながら何度も質問しました。エンジニアの応答が非常に誠実であり、会話の中ですぐに具体的な実現方法を提示してくれて、私たちに寄り添って一緒に形にしていく姿勢に、頼もしさを感じました。

今後の展開

今後はiDCNaviで蓄積したデータを分析し、省エネ運用にも繋げていきたいです。消費電力の推移を高精度に予測したり、計算ジョブ毎の消費電力を把握することが可能になるのではと期待しています。またES4のマルチアーキテクチャを、最適に利用するための指標にもできればと思います。

せっかく集めた実働データは大変貴重ですから、分析して有効に使っていきたいと思います。

iDCNaviを導入したES4のマシンルーム

システム構成

ラックのPDUと分電盤で電力量の計測を行っている他、水冷設備で水温・流量・冷却熱量を監視しています。複数メーカーのPDU・ゲートウェイを使用しているため、iDCNaviで計測値を一元化して、データを扱いやすくしています。