米国時間2024年11月18日、IBMとAMDは、「IBM Cloud with AMD Instinct MI300Xアクセラレータ」提供に向けた協業を発表した。同サービスは、2025年上半期での提供開始を予定しているという。
同サービスは、IBM Cloudのサービスとして「AMD Instinctアクセラレータ」を導入したもの。生成AIモデルや顧客向けハイパフォーマンス・コンピューティング(HPC)アプリケーションのパフォーマンスと電力効率の向上を目的としているという。詳細は以下のとおり。
- 大規模モデル推論のサポート:AMD Instinct MI300Xアクセラレータは192GBの高帯域幅メモリ―(HBM3)を搭載し、モデル推論と微調整(ファイン・チューニング)をサポート。大容量メモリにより少ないGPUで大規模なモデルを実行可能で、推論コストを削減できる
- パフォーマンスとセキュリティーの強化:AMD Instinct MI300Xアクセラレータを「IBM Cloud Virtual Servers for VPC」上のサービスとして提供。「IBM Cloud Kubernetes Service」「IBM Red Hat OpenShift on IBM Cloud」によるコンテナ・サポートを利用することで、AIアプリケーションを実行する企業のパフォーマンスを最適化できる
また、IBMは、生成AIの推論ワークロード向けに、AIおよびデータのプラットフォーム「IBM watsonx」上でAMD Instinct MI300Xアクセラレータをサポートする計画だという。これにより、watsonxを使用する顧客に、ハイブリッドクラウド環境全体でAIワークロードを拡張するための追加のAIインフラストラクチャー・リソースを提供するとのことだ。加えて、「Red Hat Enterprise Linux AI」「Red Hat OpenShift AIプラットフォーム」では、AMD Instinct MI300X アクセラレータ上でInstructLabを使用したアライメント・ツールで大規模言語モデル(LLM)のGraniteファミリーを実行できるとしている。
【関連記事】
・IBM、米・英・印・日・独の2,000社を対象に「AIリーダー」企業のAI戦略実態を委託調査
・IBM、Qiskitを活用した量子コンピューターを提供開始 次世代アルゴリズムの開発を促進
・AMD、「Versal Premium Series Gen 2」発表 24年11月に先行提供へ