AI監査の時代がやってくる|Mythos以降、企業セキュリティで何を変えるべきか

2026.06.04

Claude Mythosが示したのは、AIモデルの能力が上がったという話だけではない。本当に重要なのは、「自社のソフトウェアが、こういうAIにかかれば一瞬で脆弱性として暴かれる時代になった」という事実のほうだ。長年人間のセキュリティレビューを生き残ってきたコードが、Mythosの手にかかれば数千件単位で穴が見つかる。Project Glasswingでの実績がそれを証明してしまった。

これは、企業のセキュリティ担当者・CTO・エンジニアリングマネージャーにとって、無視できない変化だ。「うちはまだ大丈夫」と言える状況ではなくなってきている。攻撃側が同等のツールを手に入れるのが時間の問題である以上、防御側もアプローチを変える必要がある。本記事では、Mythos以降の世界で社内の脆弱性管理とAI監査をどう見直すかを、実務寄りに整理する。

何が変わったのか ── 3つの新しい現実

Mythosが現実に存在することで、企業が直面する状況は具体的に3つ変わった。

① 既存コードの「眠っていた脆弱性」が一気に表面化する

Project Glasswingが最初の1ヶ月で見つけた1万件超の重大脆弱性は、ほとんどが「広く使われているOSS」に存在していたものだ。OpenBSDから27年前のバグが出てきた事例が象徴的だが、これはOpenBSDが特別怠っていたわけではない。人間のレビューでは見つけられないレベルの欠陥が、どのコードベースにも一定数眠っていると考えるのが現実的になった。

自社のコードベースも例外ではない。むしろ、OSS以下の精査しか受けていない社内プロダクトのほうが、相対的にリスクが高い可能性すらある。

② サードパーティ・依存ライブラリの透明性が一段重要になる

自社で書いたコードだけを守っても意味がない時代になっている。npmパッケージ、PyPIライブラリ、Dockerイメージ、それらの依存関係──現代のプロダクトは外部コードの上に積み上がっている。Mythos級のツールが攻撃側に渡れば、依存ツリーのどこか1箇所の脆弱性から侵入される可能性が現実的なシナリオになる。

③ AIによる監査自体が、新しい運用課題になる

「AIに自社コードを監査させる」こと自体が新しい意思決定領域になる。どのツールを使うか、結果をどう扱うか、誤検出にどう対処するか、外部に開示するかどうか。これまでなかった運用フローを、ゼロから組み立てる必要がある

これまでの常識 vs これからの常識

具体的に、何がどう変わるのか。これまでセキュリティ業界で「ベストプラクティス」とされていた慣行と、Mythos以降に求められる慣行を並べてみる。

領域これまでの常識これからの常識
監査頻度年1回の定期監査+大型リリース時CI/CDに組み込んだ継続的AIスキャン
脆弱性の発見元CVE公開・外部報告を待つ自社で先回りして発見・対処
レビュー対象新規コード中心レガシーコードも含めた全体棚卸し
サードパーティ依存主要ライブラリのみ確認依存ツリー全体の継続監視
脆弱性管理ツールシグネチャベースのスキャナAI型の動的解析ツールを併用
開示判断個別判断明文化された開示プロセス
権限・アクセス制御役割ベース(RBAC)中心AI操作も含めた監査ログの整備

すべてを一気に変える必要はない。ただ、自社の現状が左列に寄っているなら、右列に向けて動き出す時期が来ていると考えたほうがいい。

社内で「いま、何をすべきか」

では、明日から動けることは何か。優先度別に整理する。

短期(1〜3ヶ月)

項目具体的な内容担当目安
資産棚卸し守るべきコードベース・サービス・データを一覧化セキュリティ+プロダクト
SBOM整備依存ライブラリ一覧(Software Bill of Materials)を作成開発リード
既存スキャナの結果確認DependabotやSnykの未対応Alertを洗い出す開発チーム
AI監査ツールの試験導入1プロジェクトに対象を絞ってPoC実施セキュリティリード
開示プロセスの草案作成脆弱性を見つけた際の社内フローを文書化法務+セキュリティ

中期(3〜12ヶ月)

項目具体的な内容担当目安
CI/CDへの組み込みプルリクエスト時の自動スキャンを標準化プラットフォーム
レガシーコード監査年単位で放置されてきたコードの優先順位付け監査セキュリティ+各事業部
AIガバナンス策定社内でAIを使う際のルール・許可範囲を明文化経営+法務
インシデント対応訓練AI起因の脆弱性発見シナリオでの机上演習セキュリティ
外部ベンダ評価基準の更新調達時のセキュリティチェック項目にAI監査の有無を追加調達+セキュリティ

AI監査ツールを選ぶときの観点

「AIで脆弱性を見つける」と一口に言っても、ツールによって得意分野がかなり違う。導入を検討する際にチェックすべき観点を整理しておく。

観点確認すべきこと
解析方式静的解析のみか、動的解析(実際に走らせる)もできるか
対応言語・フレームワーク自社の技術スタックをカバーしているか
誤検出率False Positiveが多すぎるとレビュー工数が爆発する
修正提案の品質「ここがバグ」だけでなく「こう直す」まで提示できるか
データの取り扱いコードを外部に送信するか、オンプレ・VPC内で動くか
監査ログ誰が・いつ・何をスキャンしたかが追跡できるか
既存ツールとの連携GitHub、GitLab、Jira、Slackなどに統合できるか
料金モデルコード量課金か、ユーザー数課金か。スケール時のコスト試算

特に重要なのは「データの取り扱い」だ。自社の機密コードを外部APIに投げるツールの場合、契約上どこまで使われるのか、学習に利用されないか、保存期間はどれくらいかを契約書レベルで確認する必要がある。法務・調達と必ず連携したい部分だ。

見落とされがちな論点 ── 倫理と法務

AIで自社コードや依存ライブラリの脆弱性を発見できるようになった、として。次に出てくるのが「見つけたものをどう扱うか」という問題だ。これは技術論ではなく、運用・倫理・法務の領域になる。

自社プロダクトの脆弱性

自社のコードに見つかった重大な脆弱性を、どのタイミングで顧客に開示するか。修正前に開示すれば攻撃の好機を与えるし、隠したまま事後発覚すれば信頼を失う。多くの企業は「Coordinated Disclosure(協調的開示)」というフレームワークに従うが、社内ルールとして事前に明文化されていないと、いざという時に判断がぶれる

サードパーティの脆弱性

使っているOSSライブラリにAIが脆弱性を発見した場合、それをメンテナーに通報するべきか、しないか。これは「セキュリティ研究者としてのマナー」と「自社の競争上の利益」が衝突しうる領域だ。Anthropic自身がProject Glasswingで採用しているのは、CERT/CCを通じた責任ある開示プロセスで、参考にしやすい。

AIの誤検出と過剰反応

AIが「これは脆弱性です」と言ったものの、実際には誤検出だった、というケースは必ず一定割合で発生する。これに毎回過剰反応していると、開発チームが疲弊する。「AIの指摘は人間のセキュリティエンジニアがトリアージする」という運用ルールを明確に置いておかないと、ノイズに溺れる。

経営層に説明するときのポイント

セキュリティ強化のための投資を経営層に提案する場面で、Mythosの話は強力な材料になる。ただし、煽る形では説得力が落ちる。整理して伝えるなら、以下の3点が要点だ。

  • 事実:Anthropicが限定公開した実例で、1ヶ月で1万件超の重大脆弱性がOSSから発見された。これは攻撃側にも同等のツールが行き渡る可能性を示している
  • 含意:自社のコードベースにも、まだ発見されていない重大脆弱性が存在する可能性が高い。これまでの監査体制では検出が難しいレベルのものを含む
  • 提案:先回りで監査体制を強化する。「攻撃を受けてから対処」のコストと、「事前にAI監査を導入」のコストを比較すれば、後者のほうが桁違いに安い

これは脅し材料というより、「守りの投資が、過去最も費用対効果の高い領域になっている」というポジティブな提案として伝えるのがいい。

おわりに ── 変化は、もう始まっている

Claude Mythosそのものを使えるかどうかは、当面、ほとんどの企業にとっては関係ない話だ。だが、Mythosが示した「AIで脆弱性を発見する」という時代の流れは、すでに動き始めている。Claude Securityのような派生プロダクトはEnterprise顧客向けにベータ提供中で、TeamやMaxプランへの拡大も予告されている。他社からも類似のツールが続々登場するはずだ。

1年後を想像すると、「AI監査を導入している企業」と「まだ手をつけていない企業」のセキュリティ水準には、はっきりした差が生まれている可能性が高い。差を生むのは技術ではなく、運用フローと意思決定の早さのほうだ。資産棚卸し、SBOM整備、開示プロセスの文書化──どれも明日から動ける項目ばかりなので、まず一歩目を踏み出してみるところから始めたい。

※本記事の情報は2026年5月時点のものです。Anthropicの製品ラインナップ・提供条件は変更される可能性があります。実際の導入検討時は、最新の公式情報をご確認ください。