米国時間2025年1月30日、NVIDIAは「NVIDIA NIMマイクロサービス」でオープンモデル「DeepSeek-R1」が利用可能になったと発表した。
DeepSeek-R1は、最先端のリーズニング機能を備えたオープンモデル。このリーズニングモデルは、直接的な応答を提供するのではなく、1つのクエリに対して複数の推論パスを実行し、思考の連鎖、コンセンサス、および検索方法を実行して回答を生成するという。
同社は、6710億パラメータのDeepSeek-R1モデルを、NVIDIA NIMマイクロサービスのプレビュー版として提供。DeepSeek-R1 NIMマイクロサービスは、単一のNVIDIA HGX H200システムで最大3,872トークン/秒を生成できるとしている。
同サービスは業界標準のAPIをサポートしており、シンプルに展開できるという。企業は、自社で選んだアクセラレーテッドコンピューティングインフラ上でNIMマイクロサービスを実行することで、セキュリティとデータプライバシーを高められるとのことだ。
また、NVIDIA NeMoソフトウェアとNVIDIA AI Foundryを併用することで、専門的なAIエージェント向けにカスタマイズされたサービスを作成することも可能だとしている。
今後、NVIDIA AI Enterpriseソフトウェアプラットフォームの一部として、ダウンロード可能なNIMマイクロサービスが提供される予定とのことだ。
【関連記事】
・HPE、NVIDIAと共同開発した「HPE Private Cloud AI」を国内提供開始
・NVIDIA、エージェンティックAIの安全性を強化する新機能「NIMマイクロサービス」を発表
・NVIDIA、トヨタ自動車ら3社をAI活用の自律化された自動車の展開パートナーに追加