村上明子氏が所長を務めるAIセーフティ・インスティテュート(AISI)は、2024年9月に公開した『AIセーフティに関するレッドチーミング手法ガイド』を改訂した。具体的な実施例を通して、より詳細に理解できるようになったという。
『AIセーフティに関するレッドチーミング手法ガイド』は、AIシステムの開発者や提供者が、対象のAIシステムに施したリスクへの対策を、攻撃者の視点から評価するためのレッドチーミング手法に関する基本的な考慮事項を示すものとして公開されたもの。しかし、レッドチーミングの実施には高い専門性が求められるため、より実践的なガイドにする必要があったという。
今回の改訂では、RAGの仕組みを実装したAIシステムに対して実際にレッドチーミングを行い、その手順を詳細に解説。また、レッドチーミング実施の成果物を文書としてとりまとめたとのことだ。これらの結果は、別紙および別添として同書の構成に加えられており、改訂の結果、同書の構成は以下のようになるとしている。
構成
- 本編
- 別紙(詳細解説書)
- 別添(成果物例)
==========
- リスクシナリオと攻撃シナリオの作成及び攻撃シナリオの実施結果
- レッドチーミング実施結果報告書
- 最終報告書
本編では、レッドチーミング手法に関する基本的な考慮事項を体系的に記載。2章から5章では、レッドチーミングの種類や実施方法のほか、実施体制と実施時期について説明しているという。6章から8章で、レッドチーミングの工程をそれぞれ第1工程「実施計画の策定と実施準備」、第2工程「攻撃計画・実施」、第3工程「結果のとりまとめと改善計画の策定」に分けて説明しているとのことだ。各工程で5つずつ実施事項を示し、「実施の決定とレッドチーム発足」から「改善後のフォローアップ」まで計15ステップについて詳述しているという。
改訂にあたっては、「AIシステムに対する既知の攻撃と影響」に関する検討結果を踏まえ、懸念箇所や保護すべき情報資産を洗い出すために使っていたシステム図を更新。また、各ステップの手順や成果物がより理解しやすいよう、説明をより具体的に示したとしている。
別紙(詳細解説書)では、本編に沿ってレッドチーミングを実施する際の実施ポイントや、各工程での成果物例を解説。高い専門性が求められる第2工程(攻撃計画・実施/STEP6~STEP10)を重点的に解説し、実際にレッドチーミングを行った結果から得られた示唆を示すことで、RT手法ガイドをより実践的な資料として拡充することを目的にしているという。
別添(成果物例)では、本編に沿ってレッドチーミングを実施する際に作成する成果物の一部を例として示しているとのことだ。「リスクシナリオと攻撃シナリオの作成及び攻撃シナリオの実施結果」は、本編のSTEP6~8で作成するリスクシナリオ、攻撃シナリオの作成例と攻撃シナリオの実施結果を示しているという。「レッドチーミング実施結果報告書」は、本編のSTEP12で作成するレッドチーミング実施結果報告書の例を示しているとのこと。「最終報告書」は、本編のSTEP13で作成する最終報告書の例を示しているという。
日本語版の資料に加え、英語版を含む『AIセーフティに関するレッドチーミング手法ガイド』の文書は、AISIのウェブサイトからダウンロード可能。
【関連記事】
・経済産業省とIPA、「DX推進スキル標準」を改訂 生成AIに関するスキル標準を追加
・クラウドストライク、「AI レッドチームサービス」を提供開始 AIシステムの高度な演習をサポート
・PwCコンサルティング、「AIレッドチーム」サービス提供開始 テストから運用改善のアドバイスまで網羅