富士通は、対話型生成AIから出力される回答の信頼性を向上する2つのAIトラスト技術である幻覚検出技術とフィッシングURL検出技術を開発。これらの技術を「Fujitsu Kozuchi(code name) - Fujitsu AI Platform」の対話型生成AIコアエンジンに搭載し、日本国内に法人向けの実証実験環境として提供開始する。
技術の概要は以下のとおり。
幻覚検出技術
対話型生成AIにおいて幻覚は固有名詞や数値などの固有表現の部分で生じやすく、質問のたびに回答内容が変化しやすい傾向を踏まえ、幻覚が生じやすい箇所を特定して重点的に確認可能。具体的には、回答文を主語、述語、目的語などに分解し、その中の固有表現部分を特定し、かつそこを空欄にして、尋ねる穴埋め質問を自動で作成する。外部の対話型生成AIへ複数回質問することで、固有表現部分の回答のばらつきを正確に捉え、幻覚スコアの算出を実現したとしている。
フィッシングURL検出技術
対話型生成AIの回答文に含まれるURL情報がフィッシングURLかどうかを判定して利用者へ画面上で提示。フィッシングURLを特定するだけでなく、AIの判断を故意に誤らせる既存の敵対的攻撃にも対応させることで、信頼性の高い判定を実現しているという。
この攻撃対策技術には、同社がBen-Gurion University of the Negevに設置した「富士通スモールリサーチラボ」で共同開発した技術を活用。AIへの攻撃がそれぞれ個別のAIモデルに向けて特化しやすい傾向を利用し、複数の異なる種類のAIモデルで処理することで生じる判定根拠の違いから攻撃データを見分けているという。対話型生成AIに限らず、帳票データを扱うAIに対する全般的な攻撃への対策にも活用が期待できるとしている。
なお、幻覚検出技術は9月28日、フィッシングURL検出技術は10月より日本国内で提供開始し、順次グローバルにも展開予定。また、個人の利用者も「Fujitsu Research Portal」上でアカウントを作成することで、トライアル利用が可能になるという。
【関連記事】
・富士通、首都圏オフィスを縮小へ 生産性向上に向けて働き方を可視化
・富士通、「RISE with SAP」プレミアムサプライヤーとして日本市場向けにクラウドERP提供へ
・富士通、SAPコンサルティング会社を買収 アジア太平洋地域でのビジネス拡大へ