ガートナージャパン(以下、Gartner)は、2027年までに生成AIソリューションの40%がマルチモーダルになる(テキスト、画像、音声、動画など複数のタイプのデータを一度に処理するようになる)との見解を発表した。
これは、2023年の1%から大幅な増加となる。このマルチモーダル化へのシフトは、人間とAIのインタラクションを強化し、生成AI対応ソリューションを差別化する機会をもたらすとしている。
同社のディスティングイッシュト バイス プレジデント アナリストであるエリック・ブレテヌー(Erick Brethenoux)氏は、次のように述べている。
「生成AI市場において、複数のモードでネイティブに学習したモデルが台頭し始めています。これにより、異なるデータ・ストリーム間の関係を把握しやすくなるだけでなく、あらゆるデータ・タイプやアプリケーションに生成AIのメリットを拡張できる可能性があります。また、環境に関係なく、人間がより多くのタスクを実行できるようAIがサポートすることが可能になります」
マルチモーダル生成AIは、Gartnerの「Hype Cycle for Generative AI, 2024(生成AIのハイプ・サイクル:2024年)」において、オープンソースの大規模言語モデル(LLM)とともに、「早期に採用することで顕著な競争優位性と市場投入までの期間短縮をもたらす可能性があるテクノロジ」として特定されているという。どちらのテクノロジも、今後5年以内に組織に大きな影響を及ぼす可能性を秘めているとしている。
Gartnerが10年以内に主流の採用に達すると予測している生成AIイノベーションの中で、その可能性が最も高い2つのテクノロジとして挙げているのが、ドメイン固有の生成AIモデルと自律エージェントだという(図1参照)。
同社のディスティングイッシュト バイス プレジデント アナリストであるアルン・チャンドラセカラン(Arun Chandrasekaran)氏は次のように述べている。
「テクノロジやベンダーが入り乱れ、めまぐるしく変化するエコシステムが原因で、生成AIエコシステムの舵取りは企業にとって極めて困難な作業となり続けるでしょう。業界再編の始まりと共に、生成AIは幻滅期に入っています。ブームが一段落すれば、今後数年間は急速なペースで機能が進歩し、さらなるメリットを得られる可能性があります」
マルチモーダル生成AI
現在、多くのマルチモーダル・モデルは2~3つのモードに限定されているが、今後数年のうちにさらに多くのモードが組み込まれるようになると同社は予測している。
ブレテヌー氏は、次のように述べている。
「現実世界では、人は、音声、視覚、感覚など、さまざまなモードの組み合わせを通して情報に接し、理解します。マルチモーダル生成AIが重要であるのは、データは通常マルチモーダルであるためです。マルチモーダル生成AIアプリケーションをサポートするために、単一モデルを複数組み合わせると、遅延や精度の低い結果につながることが多く、結果としてエクスペリエンスの質が低下します」
オープンソースのLLM
オープンソースのLLMは、商用アクセスを民主化し、開発者が特定のタスク/ユースケース向けにモデルを最適化できるようにすることで、生成AIの導入から得られる企業価値を加速させるディープ・ラーニングのファウンデーション・モデルだという。また、モデルの改善と価値の向上という共通の目標に取り組んでいる企業、学術機関、およびその他の研究機関の開発者コミュニティにアクセスできるようにするという。
チャンドラセカラン氏は、次のように述べている。
「オープンソースのLLMは、そのカスタマイズ性の高さ、プライバシーおよびセキュリティのコントロール性の高さ、モデルの透明性、共同開発を活用できる機能、ベンダー・ロックインを抑制する潜在力を通じて、イノベーションの可能性を高めます。そして最終的に、低コストで学習しやすい小規模モデルを企業にもたらし、ビジネス・アプリケーションと中核的なビジネス・プロセスを実現します」
ドメイン固有の生成AIモデル
ドメイン固有の生成AIモデルは、特定の業界、ビジネス機能、またはタスクのニーズに最適化されており、企業内でユースケースの整合性を改善すると同時に、精度、セキュリティ、プライバシーを向上させ、よりコンテキストに沿った回答を提供できるようにするという。これにより、汎用モデルの場合ほど高度なプロンプト・エンジニアリングを使用する必要がなくなり、対象を絞ったトレーニングを通じて、ハルシネーション(捏造された回答)のリスクを下げることができるとしている。
チャンドラセカラン氏は、次のように述べている。
「ドメイン固有のモデルは、より高度なレベルを起点に業界固有のタスクを実現できるようにすることで、AIプロジェクトの価値実現までの時間の短縮、パフォーマンスの向上、セキュリティの強化を達成します。これにより、汎用モデルではパフォーマンスを十分に発揮できないユースケースにも生成AIを適用できるようになるため、生成AIの採用範囲が広がります」
自律エージェント
自律エージェントは、人間の介入なしで、定義された目標を達成する複合システム。様々なAI技術を利用して、環境におけるパターンを識別し、意思決定を行い、一連のアクションを実行し、アウトプットを生成するという。自律エージェントは、環境を学習し続けることで性能が向上し、次第に、より複雑なタスクに対処できるようになる可能性を秘めていると同社は述べている。
ブレテヌー氏は次のように述べている。
「自律エージェントは、AIの能力を大きく変化させるものです。その独立したオペレーションと意思決定能力は、ビジネス・オペレーションを改善し、カスタマー・エクスペリエンスを向上させ、新しいプロダクトやサービスを創出します。これはコストの削減や競争力の強化につながり、さらには従業員の役割を『作業者から監督者へ』とシフトする組織的なワークフォースの転換をもたらすでしょう」
【関連記事】
・Gartner、デジタル・ワークプレースのハイプ・サイクル発表 新たに「AIリテラシー」が追加
・ガートナー、日本におけるセキュリティのハイプ・サイクル発表 生成AIやエクスポージャ管理など追加
・ガートナー、生成AIのハイプ・サイクル発表 2026年までに企業の80%以上が対応アプリを展開と予測