IBMは、基幹業務のセキュリティとレジリエンスを重視しながら、生成AIやエージェント型AIのユースケースを支える“低レイテンシー推論”を可能にする、AIアクセラレーター「IBM Spyreアクセラレーター」を提供開始すると発表した。
同社は2025年初めに、IBM SpyreアクセラレーターがIBM z17、LinuxONE 5、Power11で利用可能になる計画を発表していた。IBM z17およびLinuxONE 5向けには10月28日から、Power11向けには12月上旬から提供開始する予定だという。
現在、従来の論理ベースのワークフローから、エージェント型AI推論への変化が起こっている。AIエージェントには、低レイテンシーの推論とリアルタイムのシステム応答性が求められるとのことだ。IBMは、メインフレームやサーバー上で最も要求の厳しい基幹業務のワークロードを処理すると同時に、スループットを損なうことなくAIモデルを実行できることが必要だと認識したという。
このような需要に対応するためには、基幹データやトランザクション、アプリケーションのセキュリティとレジリエンスを維持しつつ、生成AIおよびエージェント型AIに対応できるAI推論用ハードウェアが求められるとのことだ。また、IBM Spyreアクセラレーターは、リスク軽減のためにミッションクリティカルなデータをオンプレミスで保持できるとともに、運用効率やエネルギー効率にも配慮した設計になっていると述べている。
IBM Spyreアクセラレーターは当初、プロトタイプ・チップとして発表され、IBMヨークタウン・ハイツの研究所でのクラスター展開や、アルバニー大学の先端AIシステム・センターなどとの協業を通じて、迅速な反復型開発により改良されたという。32個のアクセラレーター・コアと256億個のトランジスターを搭載した商用のシステム・オン・チップ(SoC)として提供されるとのことだ。
5nmプロセス技術を用いて製造され、各IBM Spyreアクセラレーターは75ワットのPCIeカードに実装されており、IBM ZまたはLinuxONEシステムでは最大48枚まで、IBM Powerシステムでは最大16枚までカードをクラスター化して、AI処理能力を拡張できるとしている。
同社はIBM Spyreアクセラレーターにより、オンプレミスでのAIアクセラレーション技術による高速かつ安全な処理を顧客に提供すると述べている。これは、IBM Z、LinuxONE、IBM Powerシステム上にデータを保持しながら、AIを大規模に活用できるという重要なマイルストーンだという。IBM ZおよびLinuxONEでは、IBM Telum IIプロセッサーとの組み合わせにより、セキュリティの強化、低レイテンシー、高トランザクション処理能力を実現するとしている。企業は、IBM Spyreアクセラレーターを使用して複数のAIモデルをスケーラブルに展開し、高度な不正検知や小売業の自動化といった予測型ユースケースを強化できるとのことだ。
IBM PowerベースのサーバーでIBM Spyreアクセラレーターを利用するユーザーは、AIサービスのカタログを活用してワークフロー全体にAIを統合することで、エンドツーエンドの業務最適化を実現できるという。IBM Power向けのIBM Spyre アクセラレーターは、オンチップ・アクセラレーター(MMA)と組み合わせることで生成AIのデータ変換を高速化し、企業内の複数の業務プロセスやシステムを、より密接かつ効率的に連携させる高スループットを実現するとしている。加えて、128のプロンプトサイズに対応し、1時間に800万件以上の文書を取り込むことが可能になるとのことだ。
【関連記事】
・IBM、一部ソフトウェア製品にAnthropicのLLM「Claude(クロード)」を統合
・日本IBM、地銀ソリューション・サービスを完全子会社化 2026年4月にはIJDSへ統合予定
・オリックス生命、コンタクトセンターシステム開発に「IBM Targetprocess」を採用
この記事は参考になりましたか?
- 関連リンク
- この記事の著者
-
EnterpriseZine編集部(エンタープライズジン ヘンシュウブ)
「EnterpriseZine」(エンタープライズジン)は、翔泳社が運営する企業のIT活用とビジネス成長を支援するITリーダー向け専門メディアです。データテクノロジー/情報セキュリティの最新動向を中心に、企業ITに関する多様な情報をお届けしています。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
この記事は参考になりましたか?
この記事をシェア