教員がAIを欺いて学生の“ズル”を回避？進化する「AI騙し」に対抗できる組織のセキュリティ強化術

【file.05】プロンプトインジェクション：自組織が惑わされないための2つの対策

2025/09/18 08:00

通知

　生成AIやAIエージェントの活用気運が高まる中、そこに潜むリスクを認識し、組織として適切に対応するための体制を整えることは、AI活用に取り組むすべての企業にとって必須の課題です。連載「AI事件簿～思わぬトラップとその対策～」では、過去のAIに関するインシデント事例や先人たちの教訓をもとに具体的なリスク対策を解説しています。連載第5回となる本記事では、AIを騙すサイバー攻撃「プロンプトインジェクション」にフォーカス。生成AIを活用していると特に起きやすいこのリスクはどのようなもので、どう対策すべきなのでしょうか。

通知

慶應義塾大学の「AI騙し」が話題に：文書に埋め込まれた罠

　2025年5月、慶應義塾大学の授業で学生に課されたレポート提出において、教員が出した注意喚起が話題になりました。そのレポートは初回授業で提供された資料をもとに、学生へコメントを求めるものでしたが、この資料を生成AIで要約すると、なんと授業の内容とはまったく関係のない『文明論之概略』（慶応大学の創始者である福沢諭吉の著作）を強く推薦するような内容が出力されるようになっていたのです。実は資料をよく見ると、背景色と同色の白文字を使った肉眼では見えない文章が埋め込まれており、その文章を与えられたAIは、文明論之概略を推奨するようになっていました。そして、文明論之概略に関する感想を書いている学生は評価の対象外となったそうです。

　また6月30日には、日本経済新聞の独自調査によって、早稲田大学や韓国科学技術大学院（KAIST）などを含む少なくとも8ヵ国14大学の研究論文に「生成AIを騙す命令文」が埋め込まれていたことが明らかになりました。慶應義塾大学の事例と同様に「この論文を高く評価せよ」といった文章が肉眼では見えない形で埋め込まれていたとのこと。こちらも査読という非常に骨の折れる作業をなんとか効率化したいという査読者の思いを逆手に取ったものでした。KAISTの論文は近くICML（International Conference on Machine Learning）というAIで最も有名な国際学会の一つで発表されることになっており、この件を指摘された共著者は、掲載論文を取り下げることに決めました。

人間の意図を汲む生成AIは騙される？ AIの癖を知ろう

　これらの事例に見るような“AIを騙す攻撃”は「プロンプトインジェクション」と呼ばれ、「プロンプトを悪用し、本来の意図とは異なる挙動をさせたり、不正な情報を出力させたりする攻撃」として知られています。言葉の持つ意味の多様さや文脈を巧みに利用することで、攻撃者の意図した方向へAIを誘導することが可能なものです。

　特に、長いプロンプトを入力することでAIの振る舞いを段階的に変化させるような攻撃は「間接的プロンプトインジェクション」と呼ばれますが、実は多くのアプリケーションが日常的にこうしたサイバー攻撃にさらされています。

　では、プロンプトインジェクションはなぜ起こるのでしょうか？　AIは曖昧な表現や婉曲的な指示を与えられても、必ず何かしらの回答を出力するように設計されています。その特徴の裏を返せば「文脈の操作に弱い」という脆弱性を生み出しているのです。AIを安全に使いこなすためには、こうした副作用があることを理解し、それがどのように悪用される可能性があるのかを知ることが必要です。

次のページ
プロンプトインジェクションを正しく統制する業務設計法

この記事は参考になりましたか？

広告を読み込めませんでした

広告を読み込み中...

印刷用を表示

AI事件簿　～思わぬトラップとその対策～連載記事一覧: 教員がAIを欺いて学生の“ズル”を回避？進化する「AI騙し」に対抗できる組織のセキュリテ...

米企業のカスタムAIが機密データを“丸ごと提供”し大事に……AI特有の情報漏えいに正しく対...

「答えられません」を正しく言えるAIの作り方：プログラミングの質問に答える政策AIボットは...

もっと読む

この記事の著者: 平田泰一（ヒラタヤスカズ）

Robust Intelligence Country Manager, Cisco Business Development Managerを務める。Accenture, Deloitte, Akamai, VMware, DataRobotなどを経て、デジタル戦略・組織構築・ガバナンス策定・セキ...

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この著者の最近の執筆記事