デロイト トーマツ コンサルティング(以下、デロイト トーマツ)は、大規模言語モデル(LLM)に企業のデータベースを接続するRAG(Retrieval Augmented Generation)に関するサービス強化のために、RAGの利便性や精度を向上する複数技術を搭載した多機能RAGアプリケーションを開発した。
RAGは、生成AIが企業内の既存知識や蓄積されたデータを活用するにあたって有用な手段である一方、大量のドキュメントの中から必要な情報を検索できない、ドキュメント中のグラフやチャートなどの視覚的情報が読み取れない、複数の問いを含む複合的な質問に回答できない、自社独自の用語をLLMが理解していないため回答が正確ではないといった課題があるという。同社は、様々な生成AIプロジェクトにてこれらの課題に対峙し、その技術ノウハウの中から、特に利便性や精度の向上に寄与する技術を集約したとしている。
多機能RAGアプリの主な機能
- 検索精度向上のための機能:複雑な質問をシンプルな質問に分解し、複数回の検索を経て回答を生成する「サブクエリ検索」、最初に複数のドキュメントを検索し選別したのちに特定ドキュメントに絞ったチャンク(意味のまとまり)単位での検索を行う「2段階検索」
- LLMの回答分野拡張のための機能:テキストだけでなくドキュメント中のグラフやチャートなどの視覚的情報を読み取り可能とする「マルチモーダル」、業界や自社特有の用語の定義を登録しその定義を踏まえた回答を生成するための「独自用語集」
- 回答精度向上のための機能:評価の高い回答を優先的に表示するために、一次保存し検索を経ずに回答を生成する「回答キャッシュ」、管理者がFAQデータ登録しそれをもとに回答を生成する「FAQ回答」
多機能RAGアプリに付随する「インデックス作成ツール」では、検索用データの作成にあたって検索精度を向上させるための様々なメタデータの付与や、マルチモーダルに対応したインデックス作成機能などが実装されているという。これにより、ドキュメントを投入するだけで多機能RAGに対応したインデックスデータを作成するとしている。
操作画面上では、回答のもとになった引用箇所や、より詳細な質問を促すフォローアップ質問が表示され、各機能の選択もON/OFF設定の切り替えにより可能。同社のコンサルタントおよびエンジニアが、クライアントのニーズに合わせた生成AIの実装において活用することで、RAGに関する開発期間の短縮および品質の向上を支援すると述べている。
多機能RAGアプリ機能(一部)
- サブクエリ検索:複合的な質問を分解し、複数回のチャンク検索を経て回答を生成
- 2段階検索:最初にドキュメントを検索し、そのドキュメントに絞ったチャンク検索を実施
- マルチモーダル:ドキュメント中の図表等を検索し、その内容を踏まえた回答を生成
- 独自用語集:業界や自社特有の用語の定義を登録し、その定義を踏まえた回答を生成
- FAQ回答:管理者がFAQデータを登録し、それをもとに回答を生成
- 回答キャッシュ:評価の高い回答をキャッシュし、検索を経ずに回答を生成
インデックス作成ツール機能
- チャンク分割:ドキュメント中のテキストおよび図表データを分割し、検索インデックスに登録
- メタデータ作成:ドキュメントの内容を表す様々なメタデータを付与
- インデックス管理:インデックスデータの追加・削除および複数インデックスへの分割登録
【関連記事】
・三井住友カード、RAG用いた生成AIの本番利用開始 問い合わせ対応を60%短縮へ
・Denodo、「Denodo Platform 9.0」リリース RAGやデータ管理強化の新機能を実装
・25周年を迎えるレッドハット、RAGではない「LAB」によるLLM最適化へ クラウド事業が売上牽引