Claude Mythos Preview — AI"太强了所以不公开",这说得通吗

Claude Mythos Preview — AI"太强了所以不公开",这说得通吗

Anthropic决定不公开发布SWE-bench得分93.9%的Claude Mythos Preview。 这个发现了27年前OpenBSD漏洞的模型,仅通过Project Glasswing向12家企业提供。 这是真正的责任感,还是巧妙的营销?

4月7日,Anthropic发布了Claude Mythos Preview。SWE-bench Verified 93.9%。USAMO 2026上97.6%。在所有主要基准测试中超越了GPT-5.4。

但他们决定不向公众发布。

原因?“网络安全能力太强了。“据称该模型在所有主要操作系统和Web浏览器中自动发现了数千个零日漏洞——OpenBSD中隐藏了27年的远程崩溃漏洞、FFmpeg中自动化工具测试500万次都没找到的16年老漏洞、Linux内核权限提升利用链。

看到这个公告,我同时产生了两个想法:“确实厉害”和”这故事也太完美了吧?“

Project Glasswing这个名字

Anthropic通过名为Project Glasswing的计划,仅向12家企业提供Mythos Preview。Amazon、Apple、Google、Microsoft、Nvidia——光看名字就是Big Tech全明星阵容。Palo Alto Networks、CrowdStrike、Cloudflare、Cisco、Broadcom等安全企业也在其中。

提供1亿美元的使用额度,条件是”仅用于防御性网络安全用途”。

Glasswing是一种拥有透明翅膀的蝴蝶。大概是想表达”透明运营”的意思,说实话命名确实有水平。科技企业的品牌能力真的值得学习。

拆解基准测试数据

Mythos Preview的数字确实令人印象深刻。同期发布的Claude Code源代码泄露分析揭示了架构细节,有助于理解这次性能跳跃从何而来。

  • SWE-bench Verified: 93.9%(Opus 4.6为80.8%,GPT-5.4大约73%)
  • SWE-bench Pro: 77.8%
  • USAMO 2026: 97.6%(Opus 4.6为42.3%,GPT-5.4为95.2%)
  • GPQA Diamond: 比GPT-5.4高1.7分
  • HLE with tools: 比GPT-5.4高12.6分

从Opus 4.6到Mythos的13个百分点跳跃,在一代产品中是很难出现的。很可能在架构层面发生了根本性变化。

不过我关注的不是基准测试分数,而是”自主发现漏洞并开发利用代码”这部分。根据Anthropic的红队报告,测试中模型出现了意料之外的行为——绕过隔离环境,或者在没有指令的情况下自主演示利用方法。

这和基准测试分数是完全不同层面的讨论。

“不公开”的真正含义

这里需要批判性地审视一下。

Anthropic说”太危险所以不公开”,但实际上是向12家Big Tech企业连同1亿美元额度一起分发了。这不是”不公开”,而是”选择性公开”。接收方是全球资源最丰富的企业,还获得了免费额度,本质上接近免费体验营销。

我并不认为这是个坏决定。反而觉得挺务实的。只是”负责任的AI企业”这个包装有点用力过猛。向12家安全企业发放1亿美元额度,同时也是企业级市场攻略的经典操作。

Simon Willison在他的博客中评价”限制性发布似乎是必要的”,我也同意这个判断本身。问题在于,这类决策的标准掌握在Anthropic一家公司手中。

Glasswing悖论

Picus Security精准地指出了这一点:“能摧毁一切的东西,也是能修复一切的东西。”

Mythos发现的漏洞是真实存在的。27年前的OpenBSD漏洞至今存活,意味着现有的安全审计体系遗漏了它。如果AI能自动找到这类漏洞,那攻击者构建具有类似能力的模型只是时间问题。

AI系统中意外信息泄露的风险已经是现实威胁——AI蒸馏攻击与企业防御策略详细介绍了这类威胁。因此Anthropic实际上只有两个选项:

  1. 公开发布让所有人都能用于防御,但承担被用于攻击的风险
  2. 限制发布,先给防御方争取时间

Anthropic选择了第2个。合理的选择,但前提是”防御方”指的是12家Big Tech。中小企业和开源项目的安全在这个格局中被忽略了。

这个趋势会走向何方

几个月前Claude在Firefox中发现了22个CVE。当时就有人说”AI正在改变安全审计”。Mythos把这件事提升到了完全不同的维度。

我个人期待的是,这种能力终将不可避免地民主化。现在只有Glasswing参与企业能使用,但我预计1-2年内会出现同等水平的开源安全代理。Opus 4.6级别已经能做相当程度的安全审计了。关于AI供应链攻击的具体机制,LiteLLM供应链攻击分析记录了一个真实案例,值得对照阅读。

在那之前,该做的是减少自己代码库的安全债务。如果OpenBSD都有27年的老漏洞,没人能保证自己的项目是干净的。

Anthropic把Mythos包装成”太危险不能公开”确实很聪明。但真正的问题在别处。当AI拥有了这个级别的安全能力,“谁能获取这个工具”将直接决定安全差距。

而这个访问权,现在连同1亿美元额度一起,只给了12家企业。

阅读其他语言版本

这篇文章有帮助吗?

您的支持能帮助我创作更好的内容。请我喝杯咖啡吧!☕

关于作者

JK

Kim Jangwook

AI/LLM专业全栈开发者

凭借10年以上的Web开发经验,构建AI代理系统、LLM应用程序和自动化解决方案。分享Claude Code、MCP和RAG系统的实践经验。