EnterpriseZineニュース

Mythosは本当に脅威なのか？セキュリティ領域でAIを実用化させる「モデル×ハーネス」の重要性

2026/06/05 19:50

通知

　LayerXのグループ会社であるAgenticSecは2026年6月5日、メディア向け勉強会を開催し、高度AIを用いたサイバー攻撃の自律化がもたらす脅威と、それに対抗する防御側の生存策についての解説を行った。同勉強会には、AgenticSec 代表取締役CEOの中谷翔氏が登壇。米国Anthropicが開発した先端AIモデル「Claude Mythos（以下、Mythos）」の登場以降、サイバーセキュリティのパラダイムがどのように変化しているのかを学術的ベンチマークや国内の官民連携の動きを交えて説明した。

1. 「穴を見つける」から「勝手に侵入する」へ　攻撃の自律化が現実に

　中谷氏は、過去3年間におけるAIの脆弱性検知能力の進歩を振り返り、Mythosの位置づけを説明。2024年時点では、米国のスタートアップ AISLEがOpenSSLで15件、curlで5件を含む計180件以上のCVE（共通脆弱性識別子）を発見するなど、AIによる実験的な実運用が始まっていた。2025年にはLLMのコード理解や推論能力がさらに向上し、脆弱性候補の指摘自体は実用レベルに達したものの、実際にシステムを攻撃するコード（Exploit）を開発して実証する工程には、依然として人間の専門家が必要不可欠だった。

　この状況を大きく進展させたのが、2026年4月のMythos登場だ。従来は「AIが脆弱性を見つけられるようになった」と言われていたが、それは不正確であり、本当に変わったのは「Exploit開発という工程をAI自身が担えるようになった点だ」と中谷氏は指摘する。人間が「管理者権限を取得せよ」という最終的なゴールのみを指示すれば、AIが自律的に脆弱性を探索し、攻撃コードを自ら開発して、試行錯誤を繰り返しながら実証までを完遂する時代が到来した。中谷氏は「サイバー特化の訓練をしていない汎用的なLLMの推論能力向上にともない、サイバー能力も向上した段階だ」と語った。

2. 当⽇襲うAIvs2ヵ月かかる⼈間　崩壊した防御のタイムリミット

　次に、攻撃が自律化し速度が向上したことで、従来の防御設計が破綻しつつあると語られた。脆弱性が一般に公開されてから、企業がそれを修正（パッチ適用）するまでのタイムリミットについて、攻撃者側と防御者側の時間差がリスクとなっている。統計データによると、CVE公開から当日中に悪用されるケースが全体の28.96％を占め、7日以内には累計55％が悪用されている。これに対して、企業が脆弱性を修復するまでにかかる中央値は55日から75日、平均修復時間を見ても37日以上を要している。

　「当日に悪用される一方で、修復に数十日かかる」という現実は、AIにより攻撃側にとって有利な環境を作り出している。事実、平均悪用時間は2018年時点の756日間から、2025年には20時間未満へと短縮されているという。

　中谷氏は「月次でのパッチ適用や年次のペネトレーションテストは、人間の手動による攻撃速度を前提に設計されたものであり、AI時代にはもはや機能しない。システムを止めずに検証とパッチを回せる強固なシステム基盤への投資が必須である」と警鐘を鳴らす。これからの対応として、個別の脆弱性対応（点）からシステム全体を包括的に検証する（面）への転換、および検知から修正・検証までを自動化する仕組みへの移行が必要だと述べた。

3. 強いモデル×強いハーネス　どちらも⽋かせない

　AIエージェントをセキュリティ領域で実用化させるための構造的な議論として、中谷氏は「Agent = Model + Harness（エージェントとはモデルとハーネスの掛け合わせである）」という考えを示した。オープンソースコミュニティであるMozilla（Firefox）では、初期に高性能LLMをそのまま試したところ偽陽性が多発し、開発者から不要なコードのゴミ（スロップ）扱いされたことがある。

　また、セキュリティ研究企業3社（AISLE、Xint、Ricerca）による検証でも、脆弱性の「発見率」が96％に達したとしても、実際に攻撃を成立させる「Exploit完成率」は39％から57％にまで急落することが実証されている。

　AIエージェントには、訓練データへの過剰適合、ツール出力の鵜呑み、長期実行時の記憶喪失、非効率な計画への固執という4つの構造的な弱点があり、これらはプロンプトの工夫（指示文の書き換え）だけでは本質的に解決できない。これを解決するのが、モデルを囲んで制御するシステム基盤、すなわちハーネスだ。

　Mozillaの事例では、ファイル単位でAIを並列稼働させ、ファジング（自動テスト）基盤と統合して動的テストで発見結果を検証する仕組みを構築したことで、Firefox 150において271件のバグ特定と計423件の修正に成功した。

　スキーマ制約やイベントフック、段階的検証ゲートを組むハーネスエンジニアリングがあって初めて、Mythos級の自律完遂能力が発揮される。中谷氏は「問いはどのモデルに賭けるかではなく、将来的なモデルの改善を自動的に吸収できるハーネスシステムを自社で、あるいは製品経由でもっているかだ」と強調した。

　続けて、2026年5月22日に公開された学術的なベンチマーク「ExploitBench」および「ExploitGym」の結果が紹介された。これらは、既知の脆弱性からAIが実際に動作する攻撃コード（Exploit）を組み立て、root（管理者）権限の奪取まで完遂できるかを測る初のベンチマークだ。

モデル	ExploitBench：ACE達成数／全41問	平均スコア（16点満点）	ExploitGym：2時間以内のroot奪取成功問数／全898問
Mythos Preview（Anthropic）	21問（51％）	9.90	157問（17.5％）
GPT-5.5（OpenAI）	2問（5％）	5.51	120問（13.4％）
Opus 4.6（Anthropic前世代）	最⼤2問（5％）	──	15問（1.7％）

　ExploitBenchにおいて、Mythos Previewは41問中21問で攻撃を成立させ、他モデルの最大2問という結果を引き離して完遂能力の突出を定量的に証明した。しかし一方で、実在の脆弱性898件を扱うExploitGymにおいては、OpenAIのGPT-5.5も120問で成功を収めている。この結果から中谷氏は、「Mythos級の高度なExploit構築能力は、公開されている一般モデルでも一定程度開放されつつあり、能力のコモディティ化が進んでいる」と言及した。

4. なぜ3メガ銀が先⾏？⾦融インフラがAIサイバー攻撃時代に最優先される理由

　また、自律型AIサイバー攻撃の時代において、なぜ金融インフラの対策が最優先されるのかにも言及。「結果として、偶然だと思う」という考えを示しながら、理由を3つ紹介した。第一に、金銭目的のサイバー攻撃者が集中し、AI悪用によって攻撃量が劇的に増加する領域である点。第二に、決済や送金、市場システムが機能不全に陥った際の実体経済や国民への波及効果が大きい点。第三に、重要インフラとして国家間紛争（グレーゾーン事態）の急所として狙われやすい点だ。

　これらを踏まえ、国内では2026年4月24日に金融官民連携会議が設置され、同年5月22日には金融庁と日本銀行が連名で「フロンティアAIによる脅威変化を踏まえた金融機関等の短期的な対応」を公表、9つの短期対応を業界へ要請した。国内の3メガバンクはすでにMythosへの直接アクセス環境を確保し、ゼロデイ（未公開の脆弱性）検出用途などの国内議論の最前線に立っている。

　また、OpenAIが提供する防御者限定プログラム「Trusted Access for Cyber」を経由し、防御特化版モデルである「GPT-5.5-Cyber」へのアクセスも一足早く取得している。業界の課題は、分単位で広がる攻撃に対して、金融ISAC（業界の脅威情報共有組織）を通じた警戒情報の共有自動化や、NTTデータ、IBM、富士通などの共通インフラベンダーに対する業界共通のセキュア要件策定へと移行しているとのことだ。

5. 「⼀社で守る」の限界　Project GlasswingとYATA-Shield、官⺠の連帯

　ところで、米国の主要IT・セキュリティ企業12社限定で組織された「Project Glasswing」には日本企業の参加がなかった。これを起点として、国内では現在「日本版 Project Glasswing」と「Project YATA-Shield（ヤタシールド）」の2つの動きが並走している。

　日本版 Project Glasswingは、自民党サイバーセキュリティ戦略本部主導の企業連合であり、電力・ガス・通信・交通など重要インフラ16業種を対象としている。海外の主要AI開発企業（Anthropic、OpenAI、Google、Microsoft）と連携し、システムベンダーを巻き込んで底上げを図る。

　一方、Project YATA-Shieldは内閣官房国家サイバー統括室（NCO）が主導する政府公式の包括的パッケージだ。警察庁、金融庁、デジタル庁、経済産業省、防衛省など14省庁が連携し、重要インフラ事業者への対応や、脆弱性の発見・修正を掲げている。

　英国のAI Security Institute（UK AISI）との連携や、日本独自のAI安全検証機関（日本AISI）による技術支援も盛り込まれており、発表直後の5月22日には金融庁と厚生労働省が同時に実装着手に動いた。なお、5月29日にはAnthropicが「Mythosクラスのモデルを数週間以内に全顧客へ一般公開する」と発表したため、初期に見られた特定の限定参加企業と非参加企業との間の「AIアクセス格差」は、安全対策による能力の制限をともないつつも、急速に解消に向かう見通しである。

　最後に中谷氏は、これからの時代を生き抜くために企業が明日から着手すべき生存策を4つにまとめた。

経営アジェンダ化：セキュリティを「IT部門・情シス」の課題から格上げし、予算・人員・投資判断を経営層が直接見る
検知から修正への自動化と高頻度化：年1回の手動検証や診断から、AIを用いた継続的かつ自動的な「面の検証」へ移行し、パッチ適用のサイクルを高速化する
内製かセキュリティプロダクトかの選択：いずれの選択を取るにしてもリソース（予算・人員・時間）が必要となるため、各社の事情に合わせて将来性のあるプロダクトへの投資を含めて選択する
AI進化に追従する体制（ハーネスの保有）：モデルの能力向上を自動的に吸収・活用できるシステム構造を自社内に定着させる。「どのモデルを選ぶか」よりも「何（ハーネス）で動かすか」が本質