本稿では、情報セキュリティ対策製品を提供するベンダー側で長らくビジネスに携わってきた筆者の経験をもとに、セキュリティ業界特有のホラーストーリー仕立てのセールストークを排し、真にとるべき情報セキュリティ対策とは何か、今どきのテーマを取り上げたうえでその本質に迫っていく。今回は、今まさにバズワードとなっているClaude Mythosについて。なぜMythosが「危険」だと言われているのか、この技術に対抗する術はないのか。また、この潮流に乗じたベンダーのセールスを正しく見極めるために、この技術が及ぼすインパクトの本質を解説する。
突如出現したClaude Mythos、政府が異例の措置を認めるレベル
2026年4月24日、片山さつき金融担当大臣、日銀総裁、3メガバンク頭取、JPX幹部らが金融庁に緊急招集された。議題はAnthropicの新型AI「Claude Mythos(クロードミュトス)」 が持つ、ゼロデイ脆弱性の自動発見能力による金融システムへの脅威についてである。政府からは、ただちに官民共同の作業部会を設置する方針が決定された。
この日本政府の「今までにない迅速な動き」は、米国当局から何らかの進言があったのではないかと著者は推測している。
ただ、この技術の悪用を防いだり、この技術からどう防御したりするかの明示的な手法は示されていない。まして日本の金融システムは、未だレガシーなシステムがその大半を占める。まさにMythos悪用の標的にされたらひとたまりもなく、金融システムは停止を余儀なくされるであろう。
先の作業部会の直後には、「個社での対処は不可能、万が一Mythosに攻撃を受けた場合は、金融機関が自らシステムを一時停止する“能動的停止”を容認することも検討せざるをえない」と一部報道され、5月には、金融庁が実際の緊急時には能動的停止を認める措置を検討していることが公にされた。
一方、政府は5月18日に、AI時代のサイバー攻撃を前提とした対策パッケージ「Project YATA-Shield」(※1)を発表し、防御側でのAI活用に向けて動き出した。三菱UFJ・三井住友・みずほの3メガバンクについては、6月上旬にMythosのアクセス権を取得したことが報じられた。
※1 Project YATA-Shield:製品やシステムではなく、①人材育成、②重要インフラ防御、③脆弱性対策、④AI安全性評価、⑤技術開発、⑥防衛警察分野強化の6分野における政府横断の方針をまとめたもの。導入すれば防御できるという類のものではなく、「何をすべきか」を示した号令に相当する。
Anthropicも意図してMythosを生み出したわけではなかった……
改めて、Mythosが出現した当初から振り返ってみよう。同技術は、2026年4月8日にPreview版(限定版)がリリースされた。しかし、正式版のリリース前にある問題が発覚した。Preview版のMythosが、27年間誰にも見つけられなかったOpenBSDの致命的なバグや、16年間・5億回以上の自動スキャンをすり抜けてきたFFmpegの脆弱性を、自律的に発見したのだ。「脆弱性を見つけて」と指示するだけで、Mythosは数時間かけてカーネルのソースコードを自律的にスキャンし、認証なしでインターネット越しにサーバーの管理者権限を奪取できるエクスプロイトを、発見から攻撃実証まで人間の介入なしに完成させてしまったということである。
これを受けて、Anthropicは「危険すぎて一般公開できない」と判断し、ただちに提供を停止した。その後、6月9日に悪用防止のセキュリティを施した“製品版”とされる「Claude Fable」が一度リリースされたが、3日後にはやはり米国政府の命令により全世界で提供停止となった(最新動向:2026年7月1日に「Claude Fable 5」が解禁された)。
なぜ、このようなAIが突如として世に出てきたのか。それは、大量のテキストデータで学習した、大規模なニューラルネットワークベースの言語モデルである大規模言語モデル(LLM)の構造に起因する。
LLMは、コードも自然言語も区別なく、すべてを「トークン」と呼ばれる文字の断片の列として処理する。つまり、プログラムのソースコードも、日本語の文章も、LLMにとっては同じ「読み物」に過ぎない。この構造が、Mythosに脆弱性を「読み解く」能力を与えた。
さらにMythosの能力を決定的にしたのが、「推論」と「自律性」の飛躍的な向上だ。
推論能力が向上したということは、思考のステップ数が増えたことを意味する。初期のLLMは、問いに対して1~2ステップの思考を経て答えを返すだけだった。しかしMythosは、「AというファイルがBという関数を呼び、BはCという構造体を参照し、Cの初期化はD関数が担うが、D関数はある特定の条件下でその処理をスキップする……」といった具合に、数十ステップにわたる論理の連鎖を途切れなく追うことができる。
人間のセキュリティ研究者が見落とし、たどり着けていない(≒発見できていない)脆弱性が、まさにこの「長い論理の連鎖」によって発見されたのだ。人間では疲れ果ててしまい、そこまでの長い論理の連鎖までたどり着けない。
そして自律性の向上が、これを実用的な脅威に変えた。自律性とは、「次に何をすべきか自分で決める能力」のことだ。「脆弱性を見つけて」という一言の指示を受けたMythosは、どのファイルを読むべきか自ら判断し、仮説を立て、検証コードを自分で書き、実行し、失敗すれば別のアプローチを試み、最終的に攻撃が成立することを実証するまで、人間の追加指示なしに完遂する。
重要なのは、これらの能力が「Anthropicが意図して設計したものではない」という点だ。コーディング能力・推論・自律性という、それぞれは普通の性能改善として積み上げられてきたものが、ある水準を超えたとき、誰も設計していなかった「脆弱性の自律的発見」という能力として突然具現化したのである。Anthropic自身も技術レポートにて、このサイバー能力は「副産物」として出現したものだと認めている。
これが問題の本質である。悪意ある目的のために開発されたわけではない。しかし、悪意ある者の手に渡れば、これほど強力な攻撃ツールはない。
この記事は参考になりましたか?
- 何かがおかしいセキュリティ連載記事一覧
-
- バズワード化する「Mythos」だが、本質を捉えられているか?セキュリティ判断を誤る前に理...
- 人類は本当にAIの制御を失ってしまうのか? 独自検証でリスクを分析、全員に考えてほしい間近...
- 「AIを使いこなせなきゃ生き残れない」と言う前に、“人類の制御”が奪われてしまう可能性が出...
- この記事の著者
-
伊藤 吉也(イトウ ヨシナリ)
2022年より、米国本社の日本支社であるフォーティネットジャパン合同会社にて全国の自治体、教育委員会向けビジネスの総括を担当。専門領域は、IPAの詳細リスク分析+EDC法による対策策定。ISC2認定 CISSP、総務省 地域情報化アドバイザー、文部科学省 学校DX戦略アドバイザー、デジタル庁 デジタ...
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
この記事は参考になりましたか?
この記事をシェア
