中谷翔 (エージェンティックセック CEO) · 06:14 「MITOS の脆弱性を検知する能力は順当に上がってきたと思うが、 脆弱性を実証する能力は飛躍的に上がった。 攻撃まで MITOS が自動で作って、 攻撃のステップまで MITOS で調整してくれて、 攻撃が成功する」
Anthropic が Claude Mythos Anthropic が 2026 年 4 月初頭に内部発表、 一部組織のみ Preview Access として展開する Claude モデル。 公式コードネームは未公開、 業界では『Mythos』 が定着。 ソフトウェアの脆弱性を発見する能力が極めて高く、 サイバー攻撃悪用リスクから一般公開が見送られた異例の運用。 アクセス権は 2026 年 5 月時点で米国政府機関 / 金融機関 / クラウド事業者など 40-50 組織に限定。 ベンチマーク Cybench で 0.83 (Opus 4.7 は 0.67)、 SWE-Bench / HLE 等の数理推論系ベンチマークでも飛躍的進化 を発表してから約 1 ヶ月後の 2026 年 5 月 14 日、 TBS Cross Dig のシリーズ 「ワンオンワンテック」 が AI セキュリティ専門家の中谷翔 (エージェンティックセック株式会社 CEO、 元 DNA / トヨタなど) を招き、 日本のメガバンク 3 行 (三菱UFJ・みずほ・三井住友) が Mythos へのアクセス権を間もなく取得するというニュースを軸に、 約 32 分の議論を展開した。
この番組は MEMEX Project Glasswing 発表記事 の続編にあたる。 Glasswing は 2025 年に Anthropic が Microsoft / Google などの 12 社限定で開始した「世界のソフトウェアを安全にするイニシアチブ」 で、 Mythos アクセス制限の前史。 番組では当時から「日本国はこれにアクセスできないで大丈夫か」 という懸念があったことを中谷が言及、 1 年経って日本側がようやく門戸を開いた、 という意味合いを整理する。
本記事は MEMEX Dario trilogy (Davos → Pentagon) や 同シリーズの Anthropic 80 倍成長編 の補完として、 日本国内のサイバー防御視点で読む価値を持つ。 中谷翔本人が 「AI エージェントでの初期侵入の完全自動化を世界初達成」 した実績を持つ専門家として、 「Mythos 自動攻撃の実証能力は本物か」 という最も技術的な論点を提示する。
メガバンク 3 行アクセス権の意義
ニュースの核心: 三菱UFJ、 みずほ、 三井住友の 3 メガバンクが Mythos アクセス権を 「間もなく入手」 する。 これは Anthropic が Mythos を 「アメリカの政府機関や金融機関、 クラウド事業者など 40-50 の組織に限定して公開」 してきた制限的運用の中で、 日本企業に初めて門戸が開かれた事例。
中谷の評価: 「純粋に状況が好転したと我々は思うべき」。 ただし懸念も明示する: 「3 メガバンクだけでいいのか。 金融もさらに広げるべきだし、 他の重要インフラ — 電力、 鉄道 — そういったところにも広げないでいいのか。 重要インフラでなくとも、 サイバーセキュリティの被害を被った時に日本国民に対して被害が大きくなるような企業に優先アクセスはいらないのか」。
なぜ金融が優先されたか、 という中谷の解説: 「近年の攻撃者は金銭目的の攻撃が大変増えている。 ランサムウェアとかなんか顕著だが、 企業に侵入して業務停止させ、 戻してほしければお金を払いなさい、 というモデル。 サイバー攻撃がお金になる時代になっているので、 金融はターゲットになりやすい」。
中谷の戦略的指摘: 「アクセスを得ていく動きを続けるためには、 Anthropic やアメリカに対しても バーターで日本に提供してよかったなと思わせることが必要。 ストレートには、 使った企業として 『こういうことを試せて、 こういう成果が出ました』 というフィードバックを Anthropic に与えていく。 政府とアクセスを与えられた企業が連携して取り組むべき」。 つまり、 アクセス権獲得は ① 一過性ではなく持続的に拡大する必要、 ② 米国側にメリットを提示しないと拡大しない、 という 2 つの構造的な制約を抱えている。
Mythos のサイバー能力は本物か — 検知から実証へのジャンプ
番組の最も技術的に重要なパートは、 中谷が Mythos の脆弱性関連能力を 2 軸で整理した部分。 「脆弱性を検知する能力は順当に上がってきた、 しかし脆弱性を実証する能力は飛躍的に上がった」。
- 脆弱性検知 (find): 2024 年からできていた。 ただし AI のハルシネーションで偽陽性も多く、 人間チェック必須。 2025 年に AI ハーネス (モデル周辺ソフトウェア + 人間チェック) が浸透して精度が向上
- 脆弱性実証 (exploit): 攻撃を実際に成立させる能力。 攻撃プログラム作成、 発動のお膳立て、 etc.。 「以前は極めてハイレベルな人間のサイバーセキュリティ専門家の力が必要」 だったが、 Mythos が自動化を達成
中谷の観察: 「Mythos プレビューアクセスのある人たちの X ポストとかを見ていると、 攻撃まで MITOS が自動で作って、 攻撃のステップまで MITOS で調整してくれて、 攻撃が成功した ということをいくつか散見しております」。 これは Anthropic 公式の Cybench サイバーセキュリティ専門 AI ベンチマーク。 オープンソースソフトウェアの脆弱性発見能力をテストする CTF (Capture The Flag) 形式の問題群。 2026 年 5 月時点で MITOS は 0.83、 GPT-5.5 は 0.83 程度に達した。 Opus 4.7 (前世代) は 0.67。 Anthropic は同様に Cybergym 等の独自ベンチマークでも MITOS を評価、 SWE-Bench / HLE 等の数理推論系ベンチマークでも飛躍的進化を確認 や Cybergym ベンチマークスコアの上昇 (0.67 → 0.83) に対応する。
中谷の業界観察: 「Mythos が出てから一気にスイッチ切り替わった。 我々のお客様 (セキュリティを守る側) との会話でも感じる。 以前は AI でセキュリティの脆弱性が見つけられること自体は専門家は知っていたが、 顧客側からは ある種お話程度だった。 Mythos 以降、 真剣な対応議論になった」。
GPT-5.5 が 2 週間で MITOS に追いつく
番組で特に注目すべき展開は、 Mythos の優位が 2 週間で揺らいだ事象。 2026 年 4 月頭に Mythos 発表 (CTF 形式 68.6% 正解)、 約 2 週間後に OpenAI が GPT-5.5 を出し、 CTF 71.4% で 誤差まで含めれば同等性能 を達成。
中谷の評価: 「Mythos もすごいけど、 GPT-5.5 というのも同等にすごい。 これは Anthropic に限った話じゃなく、 モデルのレベルが業界全体で上がっている」。 つまり、 Mythos が特別に秘伝の垂れを持っているのではなく、 「サイバーセキュリティ能力が AI モデル全般の性能向上の自然な帰結」 という仮説が成立しつつある。
ただし英国 AI Security Institute (AISI) の 5 月 14 日早朝発表によれば、 Mythos のバージョンアップが進んでおり、 企業ネットワーク模擬攻撃で「10 回中 6 回成功」 (初期版は 10 回中 3 回)、 さらに産業システム (インターネット隔離) 攻撃で「10 回中 0 回 → 3 回」 という進化を達成した。 中谷の評価: 「0 から 1 以上は大きい。 できなかったものができるってこと」。
Dario が CBS で 「半年で追いつかれるかな」 と発言していたが、 中谷の整理: 「16 日で GPT-5.5 が追いついた。 全然まだ、 みんなこういうの作ってくるという話」。 これは Dario の Davos 楽観論 と「Scientist-led AI 企業」 命題に対する重要な傍証 — Anthropic が特別なのではなく、 業界全体が同方向に進化している。
攻撃 28% 当日成立 vs 守備 55-75 日 — ギャップが拡大
番組終盤、 中谷が提示する数字は AI 時代のサイバー防御の根本問題を示す。
攻撃側の高速化: 「攻撃者が脆弱性情報を見てから攻撃ができるようになるまでの期間」 は AI の力で大幅に短縮。 「28% の脆弱性については当日に攻撃ができてしまう。 55% 程度は 7 日間もあればできる」。 これは Mythos / GPT-5.5 級のモデルを攻撃者が使った場合の数字。
守備側の遅さ: 「企業が脆弱性を守るためにパッチを当てる修正を加える期間は、 従前だと 55 日から 75 日程度」。
中谷の冷静な結論: 「ものすごいギャップが広がっている。 人間が検証するという世界ではもう間に合わない。 攻撃者が AI などを使っている中、 守る側もソフトウェアを使って自動化して守っていかないといけない」。
「侵入される前提」 の防御戦略
中谷の防御アドバイスは技術的に具体的だ。 「侵害されない方」 と 「侵害されてもより被害を抑える方」 の 2 軸で整理:
侵害されない方: 一個一個のソフトウェアを守るのではなく、 企業の使うソフトウェア全体を 自動で資産管理 し、 世の中で脆弱性情報が出た瞬間に「このシステムは影響を受けうる」 まで自動判定、 さらに「本当に攻撃経路があるか」 を脆弱性診断・ペネトレーションテストで検証、 という流れ。
侵害されてもより被害を抑える方: 「1 個目に侵入された後も他の業務システムとつながらない構成」 = マイクロセグメンテーション ネットワーク防御戦略。 企業内の業務システムを細かいセグメントに分割し、 1 つのセグメントが侵害されても他のセグメントに横移動できないように設計する手法。 従来の境界防御 (外周のみ強化) と対比される考え方。 サイバー攻撃を AI が自動化する 2026 年現実では『侵入される前提』 で設計せざるを得ず、 マイクロセグメンテーションの重要度が急上昇。 中谷翔 (エージェンティックセック CEO) は『例えば Web サーバーと社内システムを社内ネットワークで決してつなげない』 と具体例を提示 、 そして「アタックサーフェス (攻撃できる表面) を減らす」 — 例: 「Web サーバーと社内システムを社内ネットワークで決してつなげない」「内部システムを間違って外に晒さない」 など。
技術以外の補完: 「サイバー保険」。 サイバー攻撃で事業被害を被った時に保険金が下りる仕組み。 「技術や事業を掛け合わせてサイバー防御を相対的に高めていこう」 という整理。
中国アクター + AI エージェント — 完全自動化攻撃の現実
番組で重要な傍証として議論されるのは、 Anthropic 自身が 2025 年に発表した「中国のアクターが AI エージェントで完全自動化して攻撃を仕掛けた」 という報告。 これは Anthropic が観測した実例で、 「ハイレベルなサイバーセキュリティ専門家不在で AI エージェントだけが攻撃を実行・成功させた」 という、 AI 時代の自動化攻撃の早い実例。
中谷の地政学的懸念: 「日本国内に対する攻撃がどこの国から来やすいかを見ると、 中国は一つ多い国、 他にもロシアなど。 中国がより高い技術の AI モデルを持つこと自体の懸念は、 サイバーセキュリティの専門家の中でもある」。 これは 米中首脳会談 2026/05 北京 での AI 統治対話の議論 (model misbehaviors / autonomous weapons / non-state actors) と日本国内文脈で交差する論点。
編集所見 — 日本サイバー防御の構造的選択
この番組から MEMEX が抽出する整理は 3 点:
(1) Anthropic と日本政府の連携が始動した瞬間 — 米国系 AI モデルの「上位アクセス権」 を日本が外交努力で確保し始めた最初の事例。 3 メガバンク以降、 重要インフラ (電力、 鉄道、 等) や日本企業全体へのアクセス拡大が継続課題。 中谷の指摘通り、 これは バーター戦略 — 日本側から有意義なフィードバックを米国側に出し続けることでのみ持続する。
(2) 「Mythos 一強」 神話の早期崩壊 — GPT-5.5 が 2 週間で同等性能に到達したことで、 サイバー攻撃能力は Anthropic だけの問題ではなく業界全体の問題になった。 これは Project Glasswing の制限的アクセスモデルが、 Frontier モデル競争で機能しなくなる可能性を示唆する。 中国系プレイヤーが同等性能に到達する時点で、 アクセス制限自体が無効化する。
(3) 「侵入前提」 への防御パラダイム転換 — 攻撃 28% 当日 vs 守備 55-75 日 のギャップは、 従来の「侵入させない」 防御を実質的に放棄させる。 マイクロセグメンテーション、 アタックサーフェス縮小、 サイバー保険、 自動化防御プロダクト等、 中谷が提示する具体策は全て 「侵入される前提」 で組まれている。 これは日本企業のセキュリティ予算配分の根本的な見直しを必要とする。
MEMEX としては、 この番組を日本国内のサイバー防御専門家による独立評価として位置づける。 中谷翔の「AI エージェントによる初期侵入の完全自動化を世界初達成」 という実績は、 同様の能力を持つ中国アクターが日本企業を狙う場合の懸念を実体化させる。 米国側の動き (Dario Pentagon 衝突、 Glasswing、 Pentagon 7 社契約) と、 日本側の防御選択 (アクセス権獲得、 メガバンク先行、 産業全体への拡大) を接続するための基準点。
関連リソース
- Project Glasswing 発表 — Anthropic — Mythos アクセス制限の前史
- Davos 楽観論から Pentagon 実戦まで — ダリオ・アモデイ 2026 年 1-2 月 — Anthropic の Red Lines 思想
- Claude 80倍成長で AI インフラが限界 — SpaceX が Anthropic の救世主 — TBS Cross Dig 同シリーズ、 翌日配信
- 米中首脳会談 2026/05 北京 — AI チップと「3B」 — AI 統治対話の地政学
- Pentagon が Anthropic を切った後、 同じ投資家陣に契約が流れた構造 — 米国側のサイバー対応構造
- ダリオ・アモデイ 人物プロフィール