EnterpriseZineニュース

ブレインパッド、生成AIアプリケーションの「品質管理基準」を策定──ベリサーブが支援

2025/10/16 19:22

通知

　2025年10月16日、ブレインパッドは、同社が提供する「Rtoaster GenAI」に関わる説明会を開催した。

（左から）株式会社ブレインパッドエグゼクティブフェロー山崎清仁氏、株式会社ベリサーブ執行役員研究開発部長松木晋祐氏、株式会社 BrainPad AAA 代表取締役社長辻陽行氏 — （左から）株式会社ブレインパッドエグゼクティブフェロー山崎清仁氏
株式会社ベリサーブ執行役員研究開発部長松木晋祐氏
株式会社 BrainPad AAA 代表取締役社長辻陽行氏

　Rtoaster GenAIは、生成AIとレコメンド技術を活用した対話型検索ツール。ECサイトやオウンドメディアの検索窓に「AI検索」を設置でき、従来のキーワード検索よりも“曖昧なキーワード”でユーザーが検索できるようになる。また、マーケターにとっては、そのキーワードを分析することで、ユーザーの“生の声”を拾うことも可能だ。

　このように生成AIが活用される一方、「OWASP Top10（2025）」にはLLM／生成AIに関連するリスクが明記されており、対策を講じなければならない。AIエージェント事業に特化した同社子会社のBrainPad AAA 辻陽行氏は、「すべてを生成AIに任せるのではなく、フィルタリングすることなどが必要だ。プロンプトが意図しない挙動を引き起こしたり、外部データが汚染されていたりと、生成AIにできることが増えるほど、ハルシネーションや有害な出力も拡大する」と指摘。そこでブレインパッドでは生成AIの品質を担保するため、Rtoaster GenAIを対象として「品質管理基準」を策定しているという。

　Rtoaster GenAIの品質を担保するためテストを実行する際、たとえばレコメンド機能をテストする場合には、直行表やデシジョンツリーを用いた手法の適用が難しい。また、自由形式かつ非構造化データも想定しなければならず、仕様／構造ベースでのテストデータを作成することは難しいため、テスターの経験に依存するリスクも生じてしまう。そこで生成AIアプリケーションのテストにおいて先行していたベリサーブと協業し、下図のようなテストにおけるフレームワークを策定。具体的には、LLM出力を評価するPythonライブラリ「DeepEval」を用い、入力データを評価するような形だ。

　ベリサーブでは、Rtoaster GenAIを「テキストを入力することでテキストを出力する（Text-to-Text）」アプリケーションだとして、下図のような構造モデルを想定。チューニング層以上の製品テストを実行することを決めたという。

　先述したような懸念点がある中、「テスト観点基盤モデル」（下図）を策定し、各項目のメトリクスを設計。ユースケースごとに閾値をブレインパッドと会話しながら決定し、テストを実行したとする。同社松木晋祐氏は、「OpenAIの技術的な協力も取り付けながら、ブレインパッドのような企業が社会的責任を果たしながら、生成AIアプリケーションの開発生産性が向上することをサポートしていきたい」と話す。

　また、ブレインパッドの山崎清仁氏は、「テストの網羅性や客観性が高まり、実行効率も向上するなど、大きな効果がみられる。社内外に指標に基づいて説明できるようになり、安心感をもって利用いただけるようになった」と評価する。

　今後ブレインパッドは同社に留まらず、品質管理基準による効率的かつ効果的なテスト手法を他社AIサービスにも広めていき、“安全”なAIサービスの社会実装を推進していくとした。なお同社は、2025年9月18日にAIレコメンド技術の特許（特許第7745801号）を登録している。

この記事は参考になりましたか？

広告を読み込めませんでした

広告を読み込み中...

印刷用を表示

この記事の著者: 岡本拓也（編集部）（オカモトタクヤ）

1993年福岡県生まれ。京都外国語大学イタリア語学科卒業。ニュースサイトの編集、システム開発、ライターなどを経験し、2020年株式会社翔泳社に入社。ITリーダー向け専門メディア『EnterpriseZine』の編集・企画・運営に携わる。2023年4月、EnterpriseZine編集長就任。

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この著者の最近の執筆記事