AIの正答率を10%から94%に上げるメタデータの真価──“情報の付与”を実運用に乗せる3ステップ
第2回:どこから整備すべき? 投資対効果が高いメタデータ整備の重点ビジネス領域とは
コスト削減と応答速度を両立させるメタデータ付与メソッド
ファイルにメタデータを付与することのメリットは、回答精度の向上だけではありません。AIのコスト削減と応答速度の向上にもつながります。
Microsoft傘下のGitHubがGitHub Copilotを従量課金制に移行すると発表したように、AIの利用がアカウントベースから使用量ベースになってきている現状があります。コストの問題は、利用するAIモデルの性能向上にともなって深刻化しています。
また一般的に、高度な推論モデルは回答精度が高い代わりに消費するトークン量も多いため、応答速度が遅くなってしまいます。今後よりビジネスの中でAIが当たり前に浸透する未来を見据えたとき、回答精度と応答速度は両立する必要があるといえます。
このようなAIのコストとスピードの課題も、メタデータによって解決できます。最新のAIモデルであれば、「契約の有効期間は締結日から1年間とする」という記述しかないファイルから、必要な情報を抽出して「契約有効期限」を算出できます。そして、その契約有効期限の情報をメタデータとして付与すれば、次回以降はメタデータ検索をするだけで、AIのトークンを消費せず、迅速にかつ確実に必要なファイルを見つけ出すことが可能になるのです。
メタデータ付与を実運用に乗せる3ステップと費用対効果の高い領域
ファイルへのメタデータ付与は、AIの精度/スピード/コストの課題を解決する有効な手段だと解説してきましたが、アプローチを間違えるとデータ運用の破綻を招く懸念もあります。ここでは、メタデータ付与を実運用に乗せるための3つのステップを紹介します。
- メタデータテンプレートの設計:どの情報をフィールド(項目)化するかは、回答精度に直結します。フィールドが多すぎると運用負荷が高くなり、少なすぎると絞り込みが効きません。業務上どの情報が必要かを検討し、必要十分なフィールド構成を決めることが重要です
- 信頼度スコアの活用:AIが抽出したメタデータに対して「信頼度スコア」を付与することで、精度の低い抽出結果を人間がレビューする仕組みを作ることができます。すべてを自動化するのではなく、AIと人間が協力して精度を担保するアプローチとして有効な手段です
- 段階的な展開:企業にあるすべてのファイルを一斉に対象にするのではなく、投資対効果の高い領域から段階的に整備していくことが大切です。優先順位としては「属性条件での絞り込みが業務の中心にあり、再現性や正確性が強く求められる領域」から始めることをおすすめします
特にメタデータ整備の投資対効果が高い業務として、次のようなものが挙げられます。
- 契約書管理:契約金額/締結日/保管期限/契約種別/承認ステータスなど、属性条件での絞り込みが多い業務
- 規程/マニュアル類のバージョン管理:常に最新版を提供することが求められる。バージョンや有効期間といった属性情報をメタデータとして持たせることで、正確に管理可能
- 案件/プロジェクト文書の横断検索:ステータス/担当者/期日/金額といった属性をもって関連文書を俯瞰できるようになる
このようにメタデータを整備していくことで、非構造化データを“構造化データ”として扱えるようになるのです。これは複数のAIエージェントが自律的に動くマルチエージェント時代において大きなアドバンテージになります。
次回は、メタデータによる「非構造化データの構造化」が、マルチエージェント時代の業務変革においてどのような役割を果たすのか、そしてAI-Readyなコンテンツ基盤をどのように構築できるのかについて詳しく解説します。
この記事は参考になりましたか?
- 《脱・AI迷走》メタデータの掟連載記事一覧
-
- AIの正答率を10%から94%に上げるメタデータの真価──“情報の付与”を実運用に乗せる3...
- AIの精度を下げる「コンテキストの腐敗」回避術──“正しい情報”だけをつかませるメタデータ...
- この記事の著者
-
武田 新之助(タケダ シンノスケ)
20年以上にわたり、銀行の情報システム部門や日系SIerのプリセールスエンジニア、外資系ベンダーのアーキテクトとして活躍。特にコラボレーション・コミュニケーション領域において幅広い知識と豊富な経験を有する。日本マイクロソフトを経て2023年にBox Japanに移籍。プロダクトマーケティングマネージ...
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
この記事は参考になりましたか?
この記事をシェア
