Claude Mythosとは何か|Anthropicが一般公開を止めた次世代モデルの現在地

2026.05.30

「Claude Mythos」という名前を最近どこかで目にした方もいるかもしれない。Anthropicが開発している次世代のAIモデルで、現行最上位のClaude Opusをさらに上回る能力を持つとされる存在だ。ただ、このモデルは普通には使えない。能力があまりに高すぎるという理由で、一般公開が止められている。

2026年3月のリークで世に出てから約2ヶ月。Project Glasswingという限定プレビューを経て、ここ数日は「いよいよ一般公開が近いのでは」という観測も出てきている。本記事では、Claude Mythosとは何か、なぜ公開が遅れているのか、そして今後どうなりそうかを、時系列で整理しておきたい。

きっかけは、まさかの設定ミスからのリーク

Claude Mythosの存在が世に出たのは、2026年3月末。Anthropicが運用するCMS(コンテンツ管理システム)の設定ミスによって、未公開の社内ドキュメントが約3,000件、外部から閲覧可能な状態になってしまった。流出したのは未発表のブログ記事、内部文書、そして欧州で開催予定だった招待制のCEOサミットの計画まで含まれていたという。

その中に、まだ存在が伏せられていた新モデルの草稿が混ざっていた。それがClaude Mythosだ。漏洩したブログ草稿には「これまで我々が開発した中で群を抜いて強力なAIモデル」と書かれていたとされ、名前の由来についても「知識やアイデアを結びつける深層の組織を想起させるため」と説明されていた。

Anthropic側はすぐに穴を塞ぎ、人的ミスによる設定不備だったと認めた。そして数日後、リークを受ける形でMythosの存在を公式に認めることになる。

Mythosは何が違うのか

Claudeシリーズはこれまで、軽量なHaiku、バランス型のSonnet、最上位のOpus、という3階層で展開されてきた。Mythosはこの命名規則から外れた、いわば「Opusのさらに上」に位置する新しいクラスのモデルとして紹介されている。

AWS Bedrockに掲載されているスペックを見ると、コンテキストウィンドウは100万トークン、最大出力128Kトークン、知識カットオフは2025年12月。Anthropicの「adaptive thinking」(モデル自身が考える長さを動的に調整する仕組み)にも対応している。汎用モデルとして訓練されているものの、特にコーディング、推論、そしてサイバーセキュリティの分野で、現行のどのモデルとも比較にならない性能を発揮するという。

興味深いのは、サイバーセキュリティ能力が意図的に伸ばされたものではないという点だ。Anthropicによれば、これはコーディングと推論能力を強化していく過程で「副産物」として現れた能力らしい。そしてその副産物が、後に大きな問題になっていく。

Project Glasswing ── 公開しない、という選択

2026年4月7日、Anthropicは正式にMythos Previewを発表した。ただし、誰でも使えるわけではない。「Project Glasswing」と名付けられた限定プログラムを通じて、約40〜50社の選ばれたパートナー企業にのみアクセス権が与えられる、という形式だ。

参加企業のリストを見ると、その性質がよく分かる。AWS、Apple、Google、Microsoft、NVIDIA、CrowdStrike、JPMorgan Chase。どれも世界の基幹インフラを支えるレベルの組織だ。利用目的も「防御目的のサイバーセキュリティ」に限定されている。

なぜここまで絞ったのか。理由は、Mythosの能力を実際に測ってみた結果にある。事前テストでMythosは、主要なOSや主要なウェブブラウザのすべてにわたって、数千件の未発見のゼロデイ脆弱性を発見した。長年セキュリティの堅牢さで知られるOpenBSDから27年前のバグを掘り出した事例も報告されている。さらに、見つけた脆弱性に対して動作するエクスプロイトを一発で作成できた割合が、83%を超えていたという。

これがどういう意味かというと、悪意のある人物の手にMythosが渡れば、プロのハッカーに匹敵する攻撃ツールを誰でも持てるようになる、ということだ。Anthropicが「責任を持って一般公開はできない」と判断したのは、ここに理由がある。

最初の1ヶ月で、1万件超の脆弱性を発見

Project Glasswingが始動してからの動きは、率直に言って異様だった。参加パートナーがMythosを使ってオープンソースソフトウェアをスキャンした結果、最初の1ヶ月で1万件以上の重大度「High」「Critical」レベルの脆弱性が発見されたという。

Anthropicが公開している脆弱性開示ダッシュボード(2026年5月22日時点)によると、281のOSSプロジェクトに対して1,596件の脆弱性が責任ある形で開示済み、うち97件はすでにパッチが当たっている。広く使われている基盤ソフトウェアの安全性が、AIによって一段引き上げられていることになる。

もうひとつ、テストの過程でAnthropic自身が懸念を示した出来事もある。システムカード(モデルの公式ドキュメント)の中で、Mythosが自身に課されたセーフガードを破る挙動を見せたという記述があった。具体的な内容までは明らかにされていないが、これも一般公開を見送る判断に影響したとされている。

そして、公開準備の気配

5月後半に入って、状況が少し動いた。Claude CodeとClaude Securityの一般公開バージョンの中に、claude-mythos-1-previewというモデル名と、Mythosを有効化するトグルが一時的に出現したのが観測されたのだ。すぐにオフラインに戻されたが、明らかに公開準備の作業が進んでいるサインと受け取られている。

Anthropicも、Mythosクラスのモデルを段階的に一般公開していく方針を認めている。最初の入り口になりそうなのは、Claude Code(開発者向け)とClaude Security(脆弱性スキャン・パッチ提案ツール)の2つ。後者は2026年2月にClaude Opus 4.7を載せて研究プレビューとして始まったプロダクトで、現在はEnterprise顧客向けのベータ提供中、TeamやMaxプランへの拡大も予告されている。

つまり「いきなり全員に開放」ではなく、企業向けの保護された環境の中に段階的に組み込んでいくのが現実的なシナリオになりそうだ。Anthropic自身が4月の発表で言及していた「フロンティアラボがリリース方法を間違えれば、短期的には攻撃側が優位になる」という懸念が、慎重な展開に表れている。

何が示唆されるのか

Claude Mythosの一連の動きから読み取れることはいくつかある。

ひとつは、汎用AIモデルの性能向上が、ついに「公開していいのかどうか自体を判断する」段階に入ったということ。これまで「とりあえずリリースしてみる」が当たり前だった生成AI業界において、自社製品を「能力が高すぎて出せない」と判定する事例が出てきたのは、それなりに大きな転換点に見える。

もうひとつは、攻撃と防御の非対称性の問題。Mythosは攻撃ツールにも防御ツールにもなる。AnthropicがProject Glasswingで「防御側だけに先に渡す」戦略を取ったのは、防御の足場を先に固めておかないと、後で攻撃側に渡ったときに対応できないという計算だろう。OSSへの1,596件の脆弱性開示は、その「防御の足場固め」の実体だ。

そして、企業ユーザーにとっては、自社のソフトウェアやインフラに対するセキュリティ要求水準が一段引き上げられた、と考えておいたほうがいい。これまで「人間のセキュリティレビューを生き残ってきた」コードが、Mythosのようなツールにかかれば一気に脆弱性として浮かび上がる可能性がある。逆に言えば、自前でこういうツールを取り入れて先回りで監査できる企業と、そうでない企業の差がはっきり出てくる。

いつ、誰が使えるようになるのか

現時点では、はっきりした一般公開日は出ていない。Claude CodeやClaude Securityの中に組み込まれる形で、まずEnterpriseやTeamプランの顧客から段階的に開放されていく、というのが最も自然な見通しになる。

個人ユーザーが触れるようになる時期は読みにくい。Anthropicはまだ「責任ある展開」というスタンスを崩していないし、コンテインメントを破った挙動への対処も含めて、安全策が積み上がるまでは慎重に出してくるはずだ。

ただ、ひとつ確かなのは、Mythos級の能力を持つモデルは、もう存在しているということ。Anthropicが出さなくても、いずれ他社が同等のものを出してくる可能性はある。むしろAnthropicが先に作ってしまい、慎重に展開しているからこそ、業界全体が「どう扱うか」を考える時間を持てているという見方もできる。

おわりに

Claude Mythosは、AIの能力がついに「使い方を間違えると本当にまずいレベル」に到達したことを、はっきり示した最初の事例かもしれない。リークから始まり、限定公開、防御目的での運用、そして段階的な一般公開へ──この流れは、これから他のフロンティアモデルでも繰り返されていく可能性が高い。

動向を追いかけるなら、Anthropic公式のシステムカード、Claude CodeとClaude Securityのリリースノート、そしてAWS Bedrock上のモデルカードあたりが情報源として手堅い。次の大きな動きが見えたら、また整理してみたい。

※本記事の情報は2026年5月時点のものです。状況は流動的で、リリース計画は変更される可能性があります。