超えるべき壁は「データ文脈」:RAGの功罪
しかし、モデルを選定しただけでは現場の課題は解決しない。焦点は「どの文脈をモデルに渡すか」に移りつつある。Retrieval-Augmented Generation(RAG)は、社内ドキュメントを検索してLLMに添付する一般的な手法となったが、検索対象が広がるにつれてノイズや旧版ファイルの混入が深刻化し、「どの文書が必要なのか」を設計しなおすことによる担当者の負荷が増大している。
次世代標準「MCP(Model Context Protocol)」が台頭
このボトルネックを突破する有力解として、Anthropicが2024年末に公開したModel Context Protocol(MCP)が注目されている。MCPはファイルシステム、GitHub、各種SaaS APIを(USB Type-Cのように規格として)統一し、エージェントがローカルリポジトリやブラウザキャッシュなど、リアルタイムで変化する情報源まで自動で探索可能にするものだ。結果としてHarveyは契約書の最新版を即座に突き合わせ、Cursorは未コミットのコード差分を解析するなど、「文脈を押さえた者が勝つ」構図が鮮明になった。一方で、アクセス権限や監査ログをどう設計するか、という新たなガバナンスの課題も浮上している。
文脈は機密情報:セルフホストが再評価
文脈は企業機密そのものでもある。法務なら未公開のM&A資料、開発なら次期プロダクトのコード。クラウド、SaaSにデータを丸ごと預けるリスクを避けるため、エージェント基盤をオンプレミスやVPC内に構築するセルフホスト型が再評価される流れは必然だ。Harvey Enterpriseは契約書群を顧客側サーバーに閉じ込め、Jitera Self-HostedもVPC内にベクトルDBとLLMを配置して外部通信を遮断。CrowdStrikeは「Charlotte AI」のSOCログをFalconプラットフォーム内で自動トリアージし、週40時間分の調査工数を削減したと報告している。ここでの決め手は「大きなモデル」ではなく、「安全な文脈をいかに取り込むか」である。
この記事は参考になりましたか?
- EnterpriseZine Press連載記事一覧
-
- AIエージェント最前線──“文脈争奪戦”が始まった RAGの功罪、MCPの台頭……
- インド現地取材で見えた“オフショアの変化”──「静かな巨人」HCLTechからひも解く
- AIエージェントには「“新人教育”を施す必要がある」実際の活用事例から覗く、業務適用の現在...
- この記事の著者
-
栁澤 直(ヤナギザワ ナオ)
1994年生まれ。慶應義塾大学在学中にソフトウェア開発企業を設立。大型のIPOやM&Aを果たした急成長中のスタートアップを中心に開発業務に従事する。新卒でリクルートホールディングスに入社しSUUMOの開発を担当。2017年に株式会社Jiteraを設立。急成長中のスタートアップ、IPO前後、売...
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
この記事は参考になりましたか?
この記事をシェア