生成AIの2024年トレンド:本番環境化、マルチモーダル、投資対効果
──今日はAIトレンドについて伺います。まず、2023年から2024年にかけてのトレンドの変化をどのようにみていますか。
大きく3つの変化があります。まず、2023年は生成AIが注目のテーマでした。「ChatGPTが出す回答がすごいね、面白いね、LLMのパフォーマンスがすごいね」と、話題にするだけだったと思います。2024年に入り、エンタープライズユーザーの中にはPoCを実施し、本番環境でAIを動かし、ビジネス価値創出を実現しようとする企業が登場しています。
2つ目、2023年は大規模言語モデル(LLM)に焦点が当たった年だったように思います。処理言語の中には自然言語だけでなく、プログラミング言語も含まれ、多くのモデルが登場しました。続く2024年は、OpenAI Sora、Google Geminiのようなマルチモーダルモデルの年と言えるでしょう。これらのモデルは、プロンプトにテキストに加えて画像、音声、動画も入力でき、話題もこちらに移った印象です。
──生成AIテクノロジーは進化のスピードがとても速いと感じます。企業はLLMや基盤モデルとどのように向き合えばいいのでしょうか。
企業視点からの最も大きな変化は、モデルをベースにしたプロダクトの登場が確実になったことです。車で言えば、モデルはエンジンのようなもの。人がA地点からB地点に移動しようとしたとき、エンジンだけでは目的を達成できません。モデルが強力であることはわかった。次は車として使えるようにする。その車に相当するのがソフトウェアです。今後はエンタープライズユーザーにより恩恵をもたらすプロダクトが出てくると思います。
それとは別に、先進企業の中には、優れたエンジンがあれば、自力で車を走らせられるところもあります。その取り組みはうまくいくこともあれば、いかないこともあるでしょう。企業がモデルを使いこなすには、優れたプロダクトが必要だからです。ガートナーの予測では、エンタープライズ向けの既存のアプリケーション製品に生成AI機能を取り入れるところからプロダクトが提供されるとみています。
──3つ目の変化は何でしょうか。
2023年はビジネスへの創造的変化がもたらされるという期待感が高まっていたように思います。2024年に入り、やってみようと挑戦はしたものの、製品として提供できるものではない。あるいは動きはするけれども投資対効果が見合わないなど、現実に直面するところが出てきた。もちろん成功例の報告もあります。初期の段階なので、全てがうまくいったわけではない。盛り返す可能性はあります。
5つのテクノロジートレンド
──AIのトレンドをテクノロジートレンド5つとビジネストレンド4つに分けて整理していました。まず、テクノロジートレンドからそれぞれの解説をお願いします。
部門・業界特化型モデル、エージェントベースシステム、コンポジットAI
1つ目が「部門あるいは業界特化型のモデル」です。汎用的なモデルでは、満足できる出力結果を得られないことから、独自ニーズに基づき開発されたものになります。部門特化型のモデルでは、まだ代表例がありませんが、業界特化型のモデルの例としては、医療や製薬業回向けGoogle Med-PaLM2が挙げられます。
2つ目は「エージェントベースシステム」になります。ここでのエージェントとは、人間のユーザーが指示したことを人間に変わって実行してくれるAIです。3つ目の「コンポジットAI」は、複数のAI手法を組み合わせて利用することから、コンビネーションAIとも呼ばれます。
──複数の基盤モデルを組み合わせて使う場合、コンポジットAIに該当しますか。
そうではありません。ハンマーが釘を打つことしかできないように、生成AIモデルも一つの手法で、何にでも使えるわけではありません。たとえば、生成AIモデルにガードレールツールを合わせると、生成AIモデルが望ましくない振る舞いをすることを防止できますよね。車が走る道路にガードレールを設置するのと同様に、生成AIにガードレールという別のAI手法を併用するようなことが、コンポジットAIになります。
──複数のモデルを組み合わせることではないと。
この他に、生成AIモデルにナレッジグラフを組み合わせる手法もあります。ガードレールとの併用もそうですが、信頼性への懸念はとても大きなものです。プロンプトに質問を投げかけると、生成AIモデルを単独で利用すると、正しい結果を出力することもあれば、出鱈目な回答を出力することもある。情報体系を整理したナレッジグラフを組み合わせることで、出力途中にルールベースの判断を入れ、生成した回答が正しい場合は結果の出力、そうでない場合はもう一度生成するなど、ユーザーにおかしな結果を見せないような制御が可能になります。
役割の変容、オープンソースモデル
──異なるAI手法を組み合わせることで、より良いグラウンディングができるとわかりました。残りの2つのテクノロジートレンドについても教えて下さい。
4つ目が「役割の変容」です。生成AIはAIエンジニアリングプロセスを大きく変えることになるでしょう。それに伴い、D&Aやソフトウェアエンジニアリングの日々の役割も変わることになります。
5つ目は「オープンソースモデル」です。プラットフォームに何を選ぶにしろ、ホスティング環境が日本にない場合、その環境で生成AIモデルを動かすことはデータの流出になります。企業としては、ローカル(社内あるいは国内)に持ちたいと考える。また、もっとモデルの利用をコントロールしたいと考えるでしょう。さらに、ほとんどの商用モデルはトークンベースの課金です。自由に使っているとコストが際限なく膨れ上がることだってありうる。モデルの選択肢が多いこともさることながら、自社のデータセンター内でモデルを動かしたい。あるいはコストの心配なく使いたいなどの事情で、一部の企業はオープンソースモデルを選択します。