Mythosが1万件超の脆弱性を出した話と自分のコード

Anthropicが「Project Glasswing」の初期報告を公開した。
およそ50社のパートナーが1カ月で高・重大レベルの脆弱性を1万件以上発見したというやつだ。
数字だけ見ると「えぐすぎる」としか言えない。

読んでまず引っかかったのは、修正が追いついていないという部分だった。
Anthropicが独自に1000件以上のOSSをスキャンして3019件の脆弱性候補を見つけ、そのうち高・重大と判定された6202件のうち外部の先行研究から除いた1752件を精査したら90.6%が実際の脆弱性だったと報告されている。
しかも22時点で281プロジェクトに対して1596件の脆弱性を管理者に開示済みで、パッチ適用済みなのはそのうち97件だけ。
高・重大レベルに絞ると530件のうち75件しか修正されていない。

「発見できる」と「直せる」は全然別の話

この75件/530件というギャップが正直一番刺さった。
モデルが脆弱性を見つけるスピードと、人間が直すスピードがもう合ってないんだよな。
AIが「ここが危ない」と指摘しても、修正する側の人手が足りていないという状況はそのまま現実になってきた。

自分が今関わっているプロダクトのことを考えると、他人事じゃない。
社内で使っているOSSのパッケージは雑にnpm installしてpackage-lockに任せてる部分が確実にある。
dependabotのアラートも消化しきれずに積んでいる時期があった。
依存ライブラリのCVEを全部追いきるのは現実的じゃないとわかってはいるが、Mythosみたいなスキャナーが普及したら今後は「知らなかった」が通じなくなる場面も出てくる気がする。

Claude Securityをとりあえず触ってみたい

AnthropicはClaude Enterpriseユーザー向けに「Claude Security」というツールをパブリックベータで提供開始したらしい。
Claude Opus 4.7を使ったこのツールは、提供開始から3週間で2100件以上の脆弱性修正に活用されたとある。
うちのプランが対象かどうかは確認が要るが、とりあえず動かしてみたい気持ちはある。

ただ、チームに導入する前に自分で手元のリポジトリに当ててみるのが先かな、という感じ。
CIに組み込むにしても、アラートの精度と量次第でノイズになるリスクもある。
false positiveが多いと誰もアラートを見なくなるのは、dependabotで一度経験した。

# 仮にCLIがあるとしたら試したいコマンドのイメージ
claude-security scan --repo . --severity high,critical --output json > vuln_report.json
jq '.findings | length' vuln_report.json

実際のインターフェースがどうなっているかはまだ確認できていないが、出力をJSONで受けてtriage用のスクリプトに流せる構成にしたい。
高・重大だけ引っ張ってSlackに通知するだけでも、今よりは見る習慣がつくはず。

OSSメンテナ側の話も気になった

プロジェクトオーナーから見ると今回の話はかなりしんどい構図だと思う。
AIが大量に脆弱性を開示してくる一方で、修正リソースは変わらない。
自分も個人でライブラリをGitHubに置いているが、いきなり何十件もissueが飛んできたら正直パニックになる。

Anthropicが開示ダッシュボードで進捗をトラッキングしていると報告にはあった。
そこで可視化されることで多少プレッシャーにはなるかもしれないが、対応できるペルソナかどうかはメンテナそれぞれの事情に依る。
エコシステム全体の問題として、脆弱性発見の自動化とパッチ適用の自動化を同時に進めないとこのギャップは埋まらないと感じる。

「Cyber Verification Program」というセキュリティ研究者向けのクレジット制度も始めたという話も出ていた。
実際にモデルの一部を制限した形で脆弱性を発見させる取り組みらしいが、その詳細はAnthropicの公式ページを直接確認するしかない。

とりあえず今週末に自分のリポジトリのpackage-jsonを棚卸しするところから始める。
依存のサプライチェーンを一度きちんと見ておかないと、Mythosみたいなスキャナーが一般化したときに恥ずかしいことになる。

Mythosが1万件超の脆弱性を出した話と自分のコード

「発見できる」と「直せる」は全然別の話

Claude Securityをとりあえず触ってみたい

OSSメンテナ側の話も気になった

無料相談受付中