「ファスト&スロー」の知見を活用──AIが人間の思考モデルを模倣する時代へ
なぜ「2.0」になったのか。その背景には、Atlas Reasoning Engine(以降、Atlas)の強化がある。AtlasはAgentforceの頭脳に相当する推論エンジンである。実は、今回のAtlasの強化は、意思決定論と行動経済学を専門とする心理学者ダニエル・カーネマン博士の著書『ファスト&スロー あなたの意思はどのように決まるか?』に出てくる考え方に触発されてのものだ。この本で取り上げられて以来、人間の思考には「速い思考」と「遅い思考」の2つのモードがあるとする考え方が広く知られるようになった。
カーネマン博士は、人間の思考の2つのモードを以下のように説明している。
「システム1」は自動的に高速で働き、努力は全く不要か、必要であってもわずかである。また、自分の方からコントロールしている感覚は一切ない。
「システム2」は、複雑な計算など頭を使わなければできない困難な知的活動にしかるべき注意を割り当てる。システム2の働きは、代理、選択、集中などの主観的経験と関連づけられることが多い。
また、カーネマン博士は、「2つのシステムには相互作用がある。システム1が困難に直面すると、システム2が応援に駆り出され、問題解決に役立つ緻密で的確な処理を行う。システム2が動員されるのは、システム1では答えを出せないような問題が発生したときである」とも述べている。システム1の思考は、潜在記憶に蓄積している情報を基に行う分、直観的で速いが、しばしば誤った判断を行ってしまう。一方、システム2の思考は注意力を払わねばならず、結論を出すのに時間がかかるが、潜在記憶に依存しないという特徴がある。
この考え方を、LLMをインターフェースとする一般的なAIアシスタントに当てはめると、ハルシネーションが起きる理由が見えてくる。また、ユーザーが思うような回答を得られないイライラの理由も見えてくる。質問への回答や商品の注文のような基本的なタスクであれば、システム1の推論でも対応できるが、人間の作業の負荷軽減やスキルの拡張のためにAIエージェントを導入したい企業のニーズには応えられない。セールスフォースは、Agentforceの頭脳であるAtlasに「システム2」推論の能力を持ち込み、質問の文脈を理解し、適切なインサイトを提供し、アクションを提案できるようにしようと考えた。
Agentforce 2.0が変えるAIエージェント像──RAG技術で複雑な質問にも対応
Dreamforce 2024での発表時点で、AgentforceはData Cloudのデータを参照し、Sales Cloud、Service Cloud、Marketing Cloud、Commerce Cloudなどのクラウドアプリケーションで動くことができていた。シルヴィオ・サバレーゼ氏(Salesforce AI Research エグゼクティブバイスプレジデント兼チーフサイエンティスト)は、Agentforce 2.0へのジャーニーを振り返り、「エージェントができることと、Data Cloud内のデータを結びつけることが最も難しかった」と語った。
たとえば、金融機関の顧客が「金利の変化が金融資産に及ぼす影響を教えてほしい」とAIに尋ねたとする。一般的なAIアシスタントは、インターネット上の公開情報に基づき一般的な回答を出力する。おそらくプロンプトに対しては正しい回答を出力できるだろう。しかし、その顧客のポートフォリオには、金利変動の影響を受けやすい資産が含まれているかもしれない。だとすると、公開情報に基づく推論エンジンが作成した一般的な回答では、顧客ニーズを満たすことはできない。人間同様、質問の文脈を理解できないのであれば、エージェントは役に立たない。これは上司の指示の意図を理解していない部下が大勢いても、業務を遂行できない状況に似ている。
では、「子供の大学資金の準備に適した投資手段を、私の現在の収入とリスク選好に基づき教えてほしい」への的確な回答はどのようなものか。この質問のきっかけは、最初の質問と同様に、金利変動のトレンドに不安を感じていることかもしれない。ここで登場するのがシステム2推論である。セールスフォースは「エージェントループ」と呼ばれるプロセスを実装し、Atlas自らで回答を評価し、さまざまなツールやデータソースをループするプロセスを繰り返しながら、回答の質を向上させていく仕組みを構築した。クレア・チェン氏(Salesforce AI Engineering バイスプレジデント)が説明したその仕組みは下図のようになる。
AtlasはAgentforceの頭脳として、人間の思考から計画を立て、行動するまでのプロセスを模倣している。推論プロセスはリクエストの精査から始まり、結果を確認すると、Atlasはコンテキストを追加してクエリーを拡張する。そのコンテキスト情報は、Data Cloud内にある膨大なデータの中から、Advanced RAG(Retrieval Augmented Generation:検索拡張生成)を実行し、最も関連性の高いと思われるデータとメタデータの抽出で得られる。
この時、RAGチャンク(取得データの断片)にメタデータを追加できるようにしたことで、Agentforce 2.0は複雑なリクエストに対しても関連性があり、精度の高い回答を出力できるようになった。これは、追加作業なしで企業独自のビジネス慣習のような文脈理解力を備えたことを意味する。「エージェントが効率的に作業できるよう、簡単な質問と複雑な質問では、処理するパラメーターを変えている。ビジネスとお客様の深い理解に基づく推論は、パーソナライズされた信頼できる体験を提供することにつながる」とチェン氏は語った。