Claude Fable 5 と Mythos 5 — 最も高性能な公開モデルに「安全策で差し戻す」設計を載せた Anthropic (2026/06/09)

Anthropic Model Release 2026/06/09

Anthropic 公式発表 · 2026-06-09 「一部のトピックへの問い合わせには、代わりに次に高性能なモデルである Claude Opus 4.8 が応答する — そうした安全策とともに、我々はこのモデルを公開した」

2026 年 6 月 9 日、 Anthropic が同一の基盤モデルを二つの名前で公開した。一般提供の Claude Fable 5 (model ID claude-fable-5) と、限定提供の Claude Mythos 5 (claude-mythos-5)。両者は中身が同じで、違いは「安全策の有無」だけ。 Fable 5 は一般公開モデルとして同社最高性能を称する一方、 cybersecurity / 生物・化学 / model distillation の領域でフラグが立った要求を Claude Opus 4.8 に自動で差し戻す。安全策を外した Mythos 5 は Project Glasswing 経由で限られた cyber 防御者にのみ届く。

この発表の特徴は、能力・安全・アクセスを別々のレバーとして切り分けたこと。同じモデルでも、安全策の classifier がフラグを立てれば下位モデルに差し戻し、安全策を外した版は審査済みの相手にしか渡さない。「最も高性能な公開モデルを出す」と「危険な用途を絞る」を、モデルそのものではなく周辺の routing と配布で両立させた構図になっている。

Fable 5 の能力

Anthropic は Fable 5 を「ほぼ全ての評価ベンチマークで state-of-the-art」と位置付け、ソフトウェアエンジニアリング・知識労働・vision・科学研究で高い性能を主張する。第三者評価では、 Cognition の FrontierCode で「medium effort でも frontier モデル中で最高スコア」、 Hebbia の金融ベンチで「あらゆるモデル中で最高」、 IMC のトレーディング分析評価で「ほぼ全面的に攻略」と報告される (いずれも Anthropic の発表に基づく)。

具体例として Stripe のケースが挙げられる。 5,000 万行の Ruby コードベースで、本来チーム総出で 2 ヶ月超かかるコードベース全体のマイグレーションを 1 日で完了させ、「数ヶ月の工程を数日に圧縮した」という。過去の Claude より token 効率も良いとする。自律稼働の長さも強調され、「これまでのどの Claude より長く自律的に作業できる」、ゲーム Slay the Spire ではファイルベースの永続メモリが「Opus 4.8 の 3 倍」性能を押し上げたとする。 vision では科学図表から正確な数値を抽出し、スクリーンショットから Web アプリのソースを再構築し、 vision のみの最小 harness で Pokémon FireRed を完走したと報告する。

安全策 — 「次に高性能なモデルへ差し戻す」

Fable 5 の設計上の核心は自動フォールバック (classifier-based routing) 。三つの領域 — cybersecurity、生物・化学、 model distillation — で安全 classifier がフラグを立てた要求は、 Fable 5 ではなく次に高性能なモデル Claude Opus 4.8 が応答する。 Anthropic はこの発動を「平均でセッションの 5% 未満」とし、 95% 超のセッションでは差し戻しは起きないと説明する。

理由づけも明示される。 cyber については Mythos クラスのモデルが「ソフトウェアの脆弱性の発見と悪用に長け」、「サイバー攻撃を大幅に安く容易にし得る」。生物・化学では実世界の科学タスクの遂行能力が上がり、アデノ随伴ウイルス (AAV) 設計で専門特化モデルを上回った例を挙げつつ、「同じ能力が悪い手に渡れば危険なウイルスの設計を可能にし得る」。 distillation については「権威主義国家で競合モデルを訓練するために Claude の能力を大規模に抽出する」試みが、「適切な安全策なしに near-frontier 能力が拡散する」リスクを生むとする。 Anthropic は「安全策は意図的に慎重側に振っており、理想よりまだ厳しい」と認め、 launch 後に false positive を減らすと述べる。

開発者側の挙動も変わる。拒否は API でエラーではなく HTTP 200 + stop_reason: "refusal" として返り、どの classifier が拒否したかが示される。 fallbacks パラメータ (beta) や SDK middleware で別モデルへ自動リトライでき、出力生成前に拒否された要求は課金されず、リトライ時は prompt-cache の切替コストが還付される。なお Fable 5 / Mythos 5 は Covered Models に指定され、 30 日のデータ保持が課され、 zero data retention 下では利用できない。

Mythos 5 と Project Glasswing

Claude Mythos 5 は Fable 5 と「同じ基盤モデルだが、一部領域で安全策を外した」もの。米政府との協業 Project Glasswing 経由で提供され、 Claude Mythos Preview の後継にあたる。 Anthropic は Mythos 5 を「世界のどのモデルより強い cybersecurity 能力を持つ」と称する (同社の主張)。初期アクセスは cyber 防御者とインフラ提供者の小集団に限られ、現状は Glasswing パートナーが Preview から upgrade できる形。今後は cyber 組織が体系的に申請できる広い trusted access program と、生物・化学の安全策のみを外した版 (cyber 安全策は維持) を一部のライフサイエンス研究者に開く別プログラムが予定される。

Mythos 5 で示された科学成果も発表に含まれる。創薬では社内のタンパク質専門家が「設計工程の一部を約 10 倍加速」、 14 のタンパク質標的のうち 9 つで有力候補を得たとする。分子生物学の仮説では研究者が「Mythos の仮説を Opus クラス比で約 80% 選好」し、ある仮説は同じ課題に独立して取り組む研究室の研究で裏付けられたという。ゲノミクスでは 1 週間超の概ね自律的な作業で、学術誌 Science 掲載の近年のモデルを「100 分の 1 の規模ながら上回る」カスタム ML モデルを構築したと報告する (いずれも Anthropic の主張)。

命名の由来も添えられている。「Fable はラテン語 fabula (= 語られるもの) に由来し、ギリシャ語の mythos に近い。二つのモデルを分けるのは安全策である」。同じ中身に二つの名を与え、安全策の有無だけで呼び分ける、という設計思想が名前そのものに畳み込まれている。

価格と提供

価格は入力 100 万トークンあたり 10 ドル、出力 50 ドル。 Claude Opus 4.8 (入力 5 ドル / 出力 25 ドル) のちょうど倍で、旧 Mythos Preview の半額未満とされる。コンテキストは既定で 100 万トークン、最大出力は 12.8 万トークン。 adaptive thinking 常時オンが唯一の思考モードで、思考をオフにはできず、深さは effort で調整する。生の思考過程は返らず、要約版のみ取得できる。 launch 時点で effort・task budgets (beta)・memory tool・context editing (beta)・compaction・vision をサポートする。

提供は 2026 年 6 月 9 日開始。 Fable 5 は Claude API、 Claude Platform on AWS、 Amazon Bedrock、 Vertex AI、 Microsoft Foundry で一般提供。従量課金 Enterprise でも初日から利用可。サブスクリプション (Pro / Max / Team / シート型 Enterprise) では 6/9〜6/22 が追加費用なしで含まれ、 6/23 以降は usage credit が要り、容量が許せば標準提供へ戻すことを目指すとされる。 Mythos 5 は Glasswing パートナーに限定提供で、一般提供はされない。

編集所見

この release の読みどころは、モデルの能力そのものよりも「能力・安全・アクセスを別レバーに分けた」配布設計にある。従来は「強いモデルを出すか、出さないか」の二択に見えがちだった frontier の安全問題を、 Anthropic は (1) 公開版に classifier routing を仕込んで危険領域だけ下位モデルへ差し戻す、 (2) 安全策を外した同一モデルを審査済みの cyber 防御者にだけ Glasswing 経由で渡す、という二段構えに分解した。同じ中身を Fable と Mythos の二つの名で呼び分ける命名は、その思想の表明になっている。

MEMEX の観点で重要なのは、これが「red line を引いて止める」型の安全策から、「能力は出した上で、用途を routing と配布で絞る」型への移行を一次情報で示している点。 Anthropic 自身が「安全策は理想より厳しい」「false positive を減らす」と false positive の存在を前提に語る姿勢は、安全策が運用上の摩擦 (= 5% 未満のセッションが下位モデルに落ちる) を伴うことを公開で受け入れたものでもある。 Dario の Pentagon 衝突で見えた「No と言える事業構造」と、今回の「能力は出すが routing で絞る」設計は、同じ会社の安全運用の二つの面として読める。

着眼点

classifier routing という新しい安全の primitive

「危険領域でフラグが立ったら次に高性能なモデルへ差し戻す」という仕組みは、モデルを訓練段階で去勢するのでも、要求を一律に拒否するのでもない第三の道。 API では拒否が HTTP 200 + stop_reason: refusal として返り、どの classifier が拒否したかまで開示される。安全策が「モデルの内部」ではなく「モデルの周りの routing 層」に置かれたことで、公開能力と危険用途の制御を独立に調整できる構造になっている。発動はセッションの 5% 未満という数字も、摩擦の規模を定量化して見せる狙いがうかがえる。

同一モデル・二つの名 — 安全策だけが違う

Fable 5 と Mythos 5 が技術的に同じ中身で、差は安全策の有無のみ、という事実は、「モデルの危険性」が固定の属性ではなく配布条件で変わる相対的なものだ、という立場を示す。 cyber 防御者には外し、一般には差し戻す。生物・化学についてはさらに別の trusted access program で一部研究者にだけ外す。能力を一定に保ったまま、「誰に・どの領域で・どこまで」を細かく刻む配布が、 frontier モデルの新しい出し方になりつつある。

用語集

Claude Fable 5: Anthropic が 2026-06-09 に一般公開した、同社最高性能を称する公開モデル (model ID claude-fable-5)。 1M コンテキスト、最大出力 12.8 万トークン、価格は入力 10 ドル / 出力 50 ドル per 100 万トークン。 cybersecurity / 生物・化学 / model distillation でフラグが立った要求を Claude Opus 4.8 に差し戻す安全策を内蔵する。
Claude Mythos 5: Fable 5 と同一の基盤モデルで、一部領域の安全策を外した限定提供版 (claude-mythos-5)。米政府との協業 Project Glasswing 経由で cyber 防御者・インフラ提供者の小集団にのみ提供。 Claude Mythos Preview の後継。 Anthropic は「世界のどのモデルより強い cybersecurity 能力」と称する。
自動フォールバック (classifier routing): Fable 5 の安全機構。安全 classifier が危険領域 (cyber / 生物・化学 / distillation) でフラグを立てた要求を、次に高性能なモデル Claude Opus 4.8 に自動で差し戻す。発動はセッションの 5% 未満。 API では拒否が HTTP 200 + stop_reason: refusal として返り、拒否前に出力が無ければ課金されない。
Project Glasswing: Anthropic が米政府と進める協業枠組み。安全策を外した Mythos クラスのモデルを、審査を経た cyber 防御者・インフラ提供者にのみ提供する経路。 Mythos 5 は Claude Mythos Preview の後継としてこの枠組みで配布される。
adaptive thinking 常時オン: Fable 5 / Mythos 5 で唯一の thinking モード。思考の無効化はできず、深さは effort パラメータ (low〜max、既定 high) で制御する。生の chain-of-thought は返らず、要約版のみ取得可能。 Opus / Sonnet / Haiku の Messages API 挙動は従来通りで、この変更は Fable 5 / Mythos 5 に固有。

Claude Fable 5 と Mythos 5 — 最も高性能な公開モデルに 「安全策で差し戻す」 設計を載せた Anthropic (2026/06/09)