AI发现零日漏洞：Anthropic Mythos与小模型的安全能力对比分析

本文探讨了 AI 在网络安全领域的最新进展。尽管 Anthropic 发布了强大的 Mythos 模型并展示了其发现数千个零日漏洞的能力，但研究发现，小型开源模型同样能识别出相同的漏洞。这表明 AI 的安全能力并非随模型规模线性增长，真正的竞争壁垒在于集成安全专业知识的系统，而非模型本身。

核心要点

Mythos 模型发布：Anthropic 推出了 Claude Mythos 预览版及 Glasswing 项目，旨在利用 AI 发现并修复关键软件中的安全漏洞。
惊人的发现能力：Mythos 自主发现了数千个零日漏洞，包括 OpenBSD 中存在 27 年之久的陈年漏洞及复杂的 Linux 内核提权链。
小模型的反击：测试表明，小型、廉价且开源的模型在特定代码环境下，也能还原出 Mythos 所展示的大部分漏洞分析结果。
系统胜过模型：AI 网络安全能力呈现“锯齿状”分布，核心竞争力在于构建深度安全专业知识的系统，而非单纯追求模型规模。

详细分析

Mythos 的震撼表现与行业布局

2026 年 4 月 7 日，Anthropic 发布了 Claude Mythos 预览版，并成立了名为 Project Glasswing 的技术联盟。该计划投入 1 亿美元的计算额度及 400 万美元的直接捐赠，专门用于开源安全组织。Mythos 展示了极高的技术上限，它不仅能发现跨操作系统的零日漏洞，还能自主构建复杂的漏洞利用程序（Exploit），如针对 FreeBSD 的远程代码执行（RCE）和浏览器沙箱逃逸。这标志着 AI 在自动化红队测试方面迈出了重要一步。

“锯齿状前沿”：规模并非唯一标准

尽管 Mythos 的表现令人印象深刻，但研究人员通过对比测试发现了一个关键现象：当把 Mythos 发现的特定漏洞代码隔离出来并输入给小型开源模型时，这些廉价模型同样能够完成大部分相同的分析工作。这意味着 AI 的网络安全能力并不总是随着模型参数的增加而平滑提升，而是呈现出一种“锯齿状”的特征。在某些特定任务上，小模型已经具备了与顶级闭源模型竞争的潜力。

安全壁垒的重新定义

这一发现挑战了“模型即护城河”的传统观点。分析指出，真正的技术壁垒（Moat）并非模型本身，而是将深度安全专业知识融入其中的“系统”。虽然 Mythos 验证了 AI 发现漏洞的可行性，但它并未终结这一领域的竞争。未来的核心竞争力将在于如何构建能够有效发现、验证并修复漏洞的完整 AI 系统，而不仅仅是拥有最大的模型。

行业影响

该新闻揭示了 AI 网络安全领域的一个重要转折点：安全能力的民主化。随着开源小模型展现出不俗的漏洞识别能力，网络安全的攻防博弈将更加依赖于系统集成能力和专业知识的沉淀。同时，Anthropic 对开源安全的大规模投入，可能会加速全球关键基础设施的漏洞修复进程，但也对现有的防御体系提出了更高要求。

常见问题

问题：Mythos 模型发现了哪些具体的漏洞？

Mythos 自主发现了数千个零日漏洞，其中包括 OpenBSD 中一个存在 27 年的漏洞、FFmpeg 中一个 16 年的漏洞，以及 Linux 内核中的多漏洞提权链和 FreeBSD 的远程代码执行漏洞。

问题：为什么说“护城河是系统而非模型”？

因为测试显示，即使是小型开源模型也能完成 Mythos 展示的大部分漏洞分析。这表明单纯的模型规模并不能形成绝对领先，真正的优势来自于如何将安全专家的经验和逻辑构建到 AI 运行的整体系统中。

问题：Project Glasswing 的主要目的是什么？

Project Glasswing 是由 Anthropic 发起的联盟，旨在利用 Mythos 模型发现并修复关键软件中的安全漏洞，并通过提供计算额度和资金支持来加强开源软件的安全性。

小模型也能发现零日漏洞：Anthropic Mythos 后的 AI 网络安全新前沿