NVIDIAは米国時間2024年7月23日、MetaによるAIモデル「Llama 3.1」の発表を受けて、NVIDIA AI FoundryサービスとNVIDIA NIM推論マイクロサービスを発表した。
NVIDIA AI FoundryはNVIDIA DGX Cloud AIプラットフォームを活用しており、業界ユースケース向けのカスタム「スーパーモデル」を作成できるようになるとしている。企業は独自データだけでなく、Llama 3.1 405BやNVIDIA Nemotron Rewardモデルから生成された合成データを使用してモデルをトレーニングできるという。
これによりNVIDIAは、企業やソブリンAI戦略を策定している国家などによる、ドメイン固有の知識を備えたカスタムの大規模言語モデルを構築するニーズに応えるとのことだ。
また、Llama 3.1モデルの企業展開を強化するために、Llama 3.1モデル用のNVIDIA NIM推論マイクロサービスを同社サイト上で提供。NIMなしで推論を実行する場合よりも最大2.5倍のスループットを実現できるとしている。
【関連記事】
・ゼットスケーラー、NVIDIAと提携 AIアシスタント「ZDX Copilot」の機能強化
・デロイト トーマツとNVIDIA、日本市場で協業 専門チーム「エヌビディア・プラクティス」を組成
・キンドリル、NVIDIAと提携 生成AI対応ソリューションの導入を加速