「1問1答」から「複数ステップの自律実行」へ──Box Agentの構造
今回発表されたBox Agentは、このICM基盤の上に乗るAIエージェント機能の中核にあたる。
従来のBox AIは「質問と回答の1往復だけ」だった。「推論モデルが登場したおかげで、AIが次に何をすべきかを自分で考え、何往復もできる機能を実装できた。検索するか、メタデータを抽出するか、内容を生成するか──それをAI自身が判断して繰り返しながら、最終的な答えを返してくる」と浅見氏は説明する。
アーキテクチャとしては、ユーザーからの指示を受け付ける「親エージェント」の裏に、検索エージェント・Q&Aエージェント・メタデータ抽出エージェント・コンテンツ生成エージェントといった「子エージェント」が控えるマルチエージェント構成になっている。「親分が子分に何をやらせようか考えて、子分が作業して報告して、また次の指示を出す。それを繰り返して答えが返ってくる」。
ユーザーインターフェースはシンプルで、BoxのAIホーム画面に設置された自然言語の入力欄からアクセスする。「資料を分析して」「過去の提案書から関連するものを探して要約して」といった指示を与えると、エージェントが動作プロセスを可視化しながら作業を進め、最終的な成果物を返す。
従来の「Box AIハブ」とは役割が異なると浅見氏は言う。Box AIハブは人間があらかじめ情報の範囲をキュレーションしておき、その中を高速に検索する機能だった。Box Agentは「Boxの中でユーザーのアクセス権限がある領域全体」を対象に、AIが自分で判断しながら探索する。検索速度と探索深度のトレードオフを、用途に応じて使い分ける設計だ。
セッション管理の追加も大きな変化となる。これまでのBox AIはチャット履歴を保持しなかったが、Box Agentからは会話の文脈が引き継がれる。「途中で出てきた情報をいちいち説明し直さなくても、AIが理解して会話できる」という連続対話の体験がBoxの中で完結するようになる。
今回プランに追加された「Proモード」と「拡張モード」の2つのオプションも、用途の違いに応じた設計だ。Proモードは高度な推論が必要な複雑なタスクに対して、より深い思考レベルのモデルを適用する。拡張モードはコンテキストウィンドウを拡大し、大量のコンテンツを一度に処理できるようにする。「単なる探し物の時と、しっかりしたレポートを作らせる時とでは、求められる処理の深さが違う」とのことで、その使い分けをユーザー自身が選択できる。
この記事は参考になりましたか?
- EnterpriseZine Press連載記事一覧
-
- 「SaaS is Dead」へのBoxの回答──Box Agentが示すインテリジェントコ...
- なぜキャデラックF1はコーヒーマシンより先にERPを購入したのか IFSで構築したデジタル...
- NutanixはHCIからプラットフォーマーへ 年次イベントで示したVMware買収騒動後...
- この記事の著者
-
京部康男 (編集部)(キョウベヤスオ)
ライター兼エディター。翔泳社EnterpriseZineには業務委託として関わる。翔泳社在籍時には各種イベントの立ち上げやメディア、書籍、イベントに関わってきた。現在はフリーランスとして、エンタープライズIT、行政情報IT関連、企業のWeb記事作成、企業出版支援などを行う。Mail : k...
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
この記事は参考になりましたか?
この記事をシェア
