コンテナ型データセンター事業を展開するゲットワークスは2026年1月、新潟県湯沢町の「湯沢GXデータセンター」においてIBM Instana Observability(以下、Instana)の本番運用を開始した。日本IBMとともに2025年11〜12月に実施した実証実験では、NVIDIA H200 GPU 8基合計の消費電力がフル稼働時の5,520Wから負荷分散後の1,062Wへと約80%低減したことを確認。2026年3月19日、日本IBMが記者向け勉強会を開き、経緯と成果を説明した。
ゲットワークスは2014年に埼玉で1号機を稼働させて以来、現在までに300棟超のコンテナ型データセンターを構築・運用している。湯沢GXデータセンターはバイオマス発電・井水・外気を組み合わせた環境配慮型施設で、複数ベンダーの水冷GPUサーバーを統合制御する独自技術を持つ。
同社のシステムマネージャー/AIエキスパートである境川章一郎氏は、Instana導入前の状況をこう説明する。「GPUごとの稼働データ自体は、それぞれピンポイントで取ることはできていた。ただ一元的に見る仕組みがなかった」。課題として境川氏が挙げたのは三点だ。GPUごとの電力・温度・利用率・基盤状態を包括的に把握できないこと、構成変更や負荷偏りへの継続的な追跡が難しいこと、そして「複数のオープンソースツールやベンダーのツールを組み合わせた状態では、誰が見ても一気通貫でわかるダッシュボードが作れておらず、報告に耐えられるデータが出しにくかった」ことだ。
「目指したのは監視ツールの導入そのものではなく、現場で判断に使える可視化基盤を作ること」と境川氏は語る。
Instanaを選んだ経緯について境川氏はこう振り返る。「最初からInstanaを選んだわけではなく、TurbonomicやEnviziなどのラインナップをセットで紹介いただいたのがきっかけだった。ステップ2・3で設備の観測からESGレポートまで一貫して管理できる将来像に魅力を感じた」。
OpenTelemetry+DCGM+Instanaの三層構成で実証
実証実験では、NVIDIA H200 GPU 8基からNVIDIA DCGM(Data Center GPU Manager)でGPU温度・電力・利用率・メモリー・クロック・ECCエラーなどのメトリクスを取得し、OpenTelemetry Collectorを経由してInstana(SaaS)へOTLP/HTTPで送信する構成を構築した。InstanaのGPUダッシュボードとカスタムダッシュボード機能を使い、8基の状態をリアルタイムで一覧表示できる環境を整えた。
Instanaダッシュボードで電力・温度・利用率を確認しながら負荷配置を最適化した結果、8基合計の消費電力はフル稼働時の5,520W・75℃から1,062W・40℃へと低下し、約80%の低減、温度は35℃低下した。再試験でも78.7%の削減を再現している。
境川氏は成果について「Instanaを導入しただけで自動的に消費電力が下がったわけではない。可視化されたデータをもとに、エンジニアが負荷配置を変更・調整したことによる結果だ」と説明する。負荷調整の具体的な手法については「処理の分散というよりも、1台のハードウェアで可視化することが起点。OSレベルでのGPU使用率と、外側のハードウェアとしての消費電力量はこれまでバラバラに管理されていた。Instanaに統合することで削減の方法をを把握し、プログラムの修正で試しすことが出来た」と述べた。
IBM Bobで試験前後の作業時間を大幅短縮
実証実験の終盤、日本IBMからIBM BobとInstanaの連携提案を受け、急きょ取り込んで検証した。IBM Bobは、AIエージェントが対話形式でシステムの状態確認・分析・報告を担う開発支援環境だ。
境川氏はその効果をこう語る。「GPU負荷試験の前段では、監視環境の正常性確認に多めに見積もれば3〜4時間かかっていた。Bobに方針を指示するだけで10〜15分でレポートが上がってくるようになった。試験中は異常イベントの監視をBobが担い、試験後には経営層向けのエグゼクティブサマリーも自動生成した。正直、ここまで簡単にできるのかという驚きがあった」。現在は同社内でも、監視対象の拡大に向けた検証においてBobの活用を始めているという。
設備観測からESGレポートへ、段階的な拡張を計画
ゲットワークスはGPU可観測性をステップ1として、観測対象を段階的に拡大する計画を進めている。ステップ2では、液冷CDUやInRow空調ユニットのデータをSNMPとOpenTelemetryを使ってInstanaに統合する冷却設備のテレメトリー取得・可視化の技術検証が進む。あわせてAIを活用した運用支援の可能性も探っている。ステップ3ではIBM Envizi ESG SuiteとのデータをPUE(電力使用効率)やWUE(水使用効率)などの環境指標として可視化・集約する構想だ。
「動かしたGPUの処理状況や電力量がESGレポートに直結する形を最終的に目指したいところ。オープンソースの手製ツールでレポートを出すといくらでも書けてしまうが、IBMブランドのレポーティングツールで結果が出ることへの信頼性に魅力を感じている」と境川氏は語る。
制御の自動化についても「ステップ2と3の間あたりで実現したい。Kubernetesワークロードの配置最適化や使われていないリソースへのサーバー集約などを自動化し、電力削減に結びつけたい。ただし実行には必ず人の承認を挟む設計を前提とする」と述べた。
また今回の取り組みを自社データセンターだけに閉じる考えではないとも語る。「他の事業者と共同でデータセンターを作るビジネスもある中で、IBMのこの製品が我々のラインナップに加わったという位置づけで考えている。まずは自社がクライアント0となって知見を積み、他事業者への提案につなげていきたい」。湯沢GXは現在130棟超まで拡大しており、北海道や鹿児島など他拠点への展開も続いているとした。
日本IBMが描くデータセンター向けソリューションの全体像
日本IBMオートメーション・プラットフォーム事業部長の上野亜紀子理事は、データセンターを取り巻く環境をこう整理した。「クラウド・AI・5Gの加速により、データセンターはかつてないほどの需要拡大を迎えている。一方でインフラの老朽化、エネルギーコストの高騰、高度専門人材のミスマッチ、ESG対応、立地の偏在といった課題が深刻化している。これらを乗り越えるには、特定領域の短期的な解決策ではなく、データセンターのライフサイクル全体を捉えた戦略が必要だ」。
日本IBMはPlan(計画)─Operate(運用)─Optimize(最適化)のライフサイクルを通じた包括的なソリューション体系を提供しているとした。可観測性(Instana・SevOne)、ITコスト・資産管理(Apptio・Cloudability)、資源最適化(Turbonomic)、設備管理(Maximo)、ESGデータ管理(Envizi)、AIライフサイクル管理(watsonx・IBM Bob)などを組み合わせる構成だ。上野氏は「IBM自身が100ヵ国700拠点の施設管理にこれらの製品を先行活用するクライアント・ゼロとして、ハードウェアからソフトウェアまでライフサイクル全体を支援する包括的なソリューションと、自社での実践から得た知見を組み合わせて、日本のデータセンター事業者の次世代運用を支援できると確信している」と述べた。
この記事は参考になりましたか?
- この記事の著者
-
京部康男 (編集部)(キョウベヤスオ)
ライター兼エディター。翔泳社EnterpriseZineには業務委託として関わる。翔泳社在籍時には各種イベントの立ち上げやメディア、書籍、イベントに関わってきた。現在はフリーランスとして、エンタープライズIT、行政情報IT関連、企業のWeb記事作成、企業出版支援などを行う。Mail : k...
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
この記事は参考になりましたか?
この記事をシェア
