『Post-Mythos』プレビュー:AIによる攻撃の加速と回復可能性の問題
2026年6月1日
|
Anthropicは4月7日に「Mythos Preview」を発表したが、その後、リリースを見送ると発表した。このモデルは、これまで知られていなかった数千もの脆弱性を発見し、人間の助けを借りずに機能するエクスプロイトチェーンを構築し、OpenBSDにおける27年間にわたる手動レビューをくぐり抜けてきたバグを浮き彫りにした。
もうご存知でしょう。ここ数週間、受信箱はそんな話題で溢れかえっています。Mythosが攻撃対象領域にどのような影響を与えるかについて、誰もが話題にしています。
それが復元可能性にどのような意味を持つのかについて、ほとんど誰も言及していない。
まさにその議論が必要なのです。なぜなら、それによって理事会の議論、予算の議論、そして保険に関する議論が、一挙に変わるからです。
Mythosは単発の事例ではない。Mythosのプレビュー発表の5ヶ月前、AnthropicはAIが主導した最初のスパイ活動を公表していた。 中国政府系とみられるグループが、Claude Codeを作戦エンジンとして利用し、約30の組織を標的にした。AIは作業の80~90%を自律的に処理した。その2ヶ月前には、Anthropicが、サイバー犯罪者がClaude Codeを使用して、政府、医療、緊急サービス分野の17の組織に対してデータ恐喝作戦を実行していたことを記録している。
Anthropic社は、他の研究所も6~18カ月以内に同等の攻撃能力を獲得すると見込んでいる。また、アラン・チューリング研究所の研究者たちは、同様の能力が一般のエコシステムに普及すれば、管理されたモデルがいかに迅速に複製、改変、あるいは検閲解除される可能性があるかを指摘している。
もし取締役会向けの資料で、最先端のAIを依然として「将来の脅威」として位置付けているなら、そろそろそのパワーポイントのスライドを更新すべき時です。その技術はすでに存在しています。唯一の不確定要素は、普及のスピードだけです。
ミトスの対応には盲点がある
『Mythos』後の議論は、予想通りの展開を見せている。AIによって攻撃のタイムラインが短縮されるのであれば、防御側にはAIを活用した検知能力の向上、より迅速なアラート発令、そしてより高度な自動対応が求められることになる。
その理屈は、その範囲内では正しい。検知能力は重要だ。速度も重要だ。こうしたアドバイスに、特に目新しい点があるわけではない。
しかし、議論の大部分は、攻撃者がどれだけ素早く行動できるか、そして防御側がどれだけ素早くそれを検知できるかという2つの要素を中心に展開されている。その根底にある前提は、検知の遅れを埋めることが、企業の存続につながるというものである。
その思い込みが裏切られた瞬間、私たちはその場に居合わせた。
Fenix24の復旧チームは、SOCが十分に整備され、EDRのカバー範囲も広く、検知速度も速い組織であっても、数週間にわたってシステムが停止したままの状態に陥るケースを数多く目にしてきました。検知機能自体は想定通りに機能したものの、Active Directoryは破壊され、バックアップは暗号化され、依存関係の連鎖も不明確なままであり、何が最優先で復旧すべきか、あるいは復旧にどれくらいの時間がかかるのかについて、誰も確信を持って断言できない状況でした。
英国AI安全研究所(AISI)はMythosを独自に評価し、10回の試行のうち3回で32段階からなる企業ネットワーク侵入シミュレーションを完了させたことを確認した。これは、これまでのどのモデルも達成したことのないベンチマークである。またAISIは、評価が多層防御や人間の対応者を伴わない簡略化された環境下で実施された点にも言及している。
ブルース・シュナイアーは、Mythosについて「必然的であり、驚くべきことでもない」と評し、真に学ぶべき教訓は変わっていないと主張した。組織には依然として、優れたアーキテクチャ、最小権限の原則、適切な文書化、そして継続的なテストが必要である。ベインも同様の指摘を行い、AISI自身のテストでは、Mythosが堅牢な防御体制に対して自律的な攻撃を確実に実行することはできず、ほとんどの企業はまず古い問題の修正から着手すべきだと述べた。
彼らの言う通りだ……しかし、根本的な要素が一つまだ欠けている。
回復。
「検知」は何かが起きていることを知らせるものです。「復旧」は、事業が正常に戻るかどうかを決定づけるものです。業界では、これらを依然として別々の問題として扱っています。しかし、実際のインシデントにおいては、これらは同一の事象における連続した段階に過ぎません。そして、長年にわたり、第2の段階は第1の段階に比べて、十分な資金やテストが割かれてきませんでした。
堅牢な環境は攻撃者のコストを押し上げますが、復旧体制が未検証のままでは、最悪の事態が起きて初めて、自分がその境界線のどちら側にいるのかが分からなくなる可能性があります。
「回復は自然に好転するだろう」と期待する余地は、もはやない。
3つの会話がもっと簡単になりました
現在の状況は、ここ数年で最も回復に向けた投資を説得しやすくなっている好機です。今こそ、こうした議論を積極的に進めるべき時です。
取締役会での会話
かつて経営陣は「当社のツールでこの攻撃を検知できるか?」と尋ねていました。しかし今では、「事業を回復させることができるか?」を知りたがっています。
この変化により、多くのセキュリティプログラムがこれまで避けてきた議論の余地が生まれています。セキュリティチームの大半は、検知に関する指標については報告できますが、復旧に関する指標について、同じ確信を持って報告できるチームははるかに少ないのです。
現実的なシナリオ(Active Directoryの侵害、バックアップへの攻撃、通信障害など)に基づいて復旧時間を検証したことがない場合は、その旨を伝え、テストの実施を提案してください。実際のインシデント発生時に問題が発覚するよりも、「この課題を特定しました。解決策は以下の通りです」と提示した方が、取締役会の反応はより好意的になります。
保険についての話し合い
サイバー保険の引受担当者は、予防策だけでなく、復旧能力についてもますます質問するようになっています。申込書では、バックアップの耐障害性、実証済みのRTO(目標復旧時間)、および復旧手順について詳しく尋ねるようになっています。
テスト済みの復旧能力(変更不可能なバックアップ、検証済みの復元、マッピングされた依存関係、測定済みの復旧時間)を実証できれば、補償範囲、保険料、および免責事項に関してより有利な立場に立つことができます。もし実証できない場合、保険会社のアクチュアリーはその不確実性を保険料に反映させることになります。
また、いくつかの通信事業者は、バックアッププロセスの証拠だけでなく、復旧テストの証拠を補償の条件として求める方向へと動いています。契約更新が近づいているなら、テスト済みの復旧実績は、ダッシュボードが緑色であることよりもはるかに価値があります。
規制に関する議論
SECの開示規則では、すでに重大なサイバーセキュリティインシデントについて、4営業日以内に報告することが義務付けられています。システムがダウンし、情報が不完全な状況下で、その重大性をどのくらいの速さで判断できるでしょうか?
DORA(EUの金融セクターに関与するすべての組織を対象とする)はさらに踏み込み、組織に対し、シナリオに基づくテストを通じてデジタル・オペレーショナル・レジリエンスを実証することを求めています。回復能力は、単に暗黙の要件として扱われるのではなく、規制に明文化されています。
各管轄区域において、その方向性は明確です。規制当局の姿勢は、「計画はあったか?」から「実際にテストを行い、その結果を証明できるか?」へと移行しつつあります。検証されたことのない文書化されたRTO(復旧目標時間)は、運用上のリスクであるだけでなく、コンプライアンス上のリスクにもなりつつあります。
次は何が待っているのでしょうか?
Mythosの後継モデルは、あらゆる点でより優れたものになるでしょう。
これは、過去3年間にわたりあらゆるフロンティア研究所が公表してきた推移であり、Mythosの動向からは、その曲線が横ばいになりつつある兆候は一切見られない。Anthropicはこのデータを公表しないことを選んだ。同等の能力に到達する次の研究所は、異なる選択をするかもしれない。あるいは、その能力が外部に漏れるかもしれない。あるいは、独立して再現されるかもしれない。封じ込めの問題は興味深いものだが、それこそがあなたを夜も眠れなくさせるような懸念事項ではない。
攻撃能力が汎用化・自動化された今、私たちは自問しなければならない。「攻撃を受けた後、どうなるのか?」と。
この次の段階をうまく乗り切れる組織とは、復旧を、検知や対応と同じ厳格さをもって取り組むべき工学的な分野として捉えている組織である。そこが差別化の鍵となる。実際、これは昔から変わらない事実だ。MythosとフロンティアAIは、単に、これに対処しないための最後の「もっともらしい言い訳」を取り除いただけに過ぎない。
「ミトス」後の世界におけるレジリエンスと復興
レジリエンスや復旧能力に関する想定の多くは、実際の攻撃が発生すると通用しなくなる。
- 「不変のバックアップ」は、結局のところ不変ではなかったことが判明した。
- 破壊されるのはデータだけではありません。インフラも破壊されます。
- 資産と依存関係のマッピングが不十分だと、数日あるいは数週間にわたるダウンタイムが発生する。
- RTOやRPOは現実的ではありません。
アナリストたちは、レジリエンスの未来についてあらゆる側面を明らかにしています。真のサイバーレジリエンスを構築・実行するための青写真をお探しですか?Omdiaの新しい技術検証レポート『Fenix24を活用したレジリエンスの構築と実行』をダウンロードしてください。
情報漏洩が発生する前に、自社の状況を把握しておく
Fenix24は、1,000件を超える情報漏洩対応案件で得られた知見をもとに、当社の評価手法、ツール、およびサイバーレジリエンス・プログラムを構築しました。
当社のレジリエンス評価が提供される理由は、一般的なセキュリティ評価では、ランサムウェア攻撃発生時に真に重要な要素がカバーされていないためです。境界防御や検知ツールに対する形式的な監査は必要ありません。必要なのは、最悪の事態に直面した際、自社が生き残れるかどうかを知ることです。当社のエンタープライズグレードのレジリエンスプラットフォーム「Argos99」を基盤とする本評価では、以下の点について他社に類を見ない可視性を提供します:
バックアップの耐障害性。環境を把握し、特権資格情報を保持している攻撃者に対して、バックアップは耐えうるでしょうか?環境の他の部分が侵害された場合でも、バックアップから復元することは可能でしょうか?
依存関係のマッピングと復旧手順。何が何に依存しているかについて、最新のモデルはありますか?また、復旧順序はそれらの関係に基づいて決定されているのでしょうか、それとも誰も検証していない仮定に基づいているのでしょうか?
IDインフラの復旧。Active Directoryをゼロから再構築することは可能ですか?それにはどれくらいの時間がかかりますか?貴社のチームは、プレッシャーのかかる状況下でもそのプロセスを実行できますか?
運用上の復旧能力。通信環境が悪化したり情報が不完全な状況下でも、チームは復旧手順を適切に実行できるか。また、その所要時間を測定した者はいるか。
復旧ギャップ分析。計画のどの部分に問題があるか?どのギャップが最も大きなリスクをもたらすか?まず何を改善すべきか?
復旧能力をテストしてみませんか?今すぐレジリエンス評価をご予約ください。お電話(423.305.7890)またはメール(info@fenix24.com)にてお問い合わせください。




