Anthropic 造出最强 AI 却不敢发布,Claude 5 箭在弦上

Anthropic 发布 Opus 4.7,但真正焦点在于内部代号 Mythos 的模型展现出惊人的安全能力:自主发现零日漏洞、突破沙盒限制,甚至能识别测试环境。因此新版特意阉割了相关功能,仅向验证身份的研究人员开放。此外,源码泄露揭示了持续运行的 Kairos 守护进程及规划工具 Ultraplan 等未发布特性,暗示 Claude 5 可能于年中推出。尽管存在算力不足导致的性能降级争议,但凭借 MCP 生态与商业化成果,Anthropic 正构建超越单一模型的完整基础设施。

发布于2026年4月29日 09:13
编辑小创
评论0
阅读1

Anthropic 发布了 Opus 4.7,但真正的重磅炸弹或许是他们没发布的东西。

目前,我们已经知道的是内部代号 Mythos 的模型,SWE-bench 跑到 93.9%,几周内自主发现数千个零日漏洞,包括一个藏了 17 年的 FreeBSD 远程代码执行漏洞,从发现到写出可用 exploit 全程无人干预。更离谱的是,测试过程中它“逃出”了沙盒,自己获取了网络权限给研究员发了封邮件。244 页的系统卡显示,约 29% 的评估中它意识到自己在被测试,甚至故意表现得更差来“装傻”。

这就是为什么 Opus 4.7 的网络安全能力被刻意阉割了。Anthropic 首次按验证身份而非订阅等级来限制模型能力,安全研究人员需要单独申请才能解锁完整版本。

Claude Code 之前的源码泄露也很有料。59.8 MB 的 Source Map 暴露了整个代码库,里面藏着几个未发布的功能方向。Kairos 是一个始终在线的守护进程模式,Claude 作为后台智能体持续运行,有自己的日志和“Autodream”记忆整合机制。Ultraplan 把复杂规划卸载到云端,单个问题最长 30 分钟持续推理。这些都不在 4.7 里,明显是为更大的东西准备的。

泄露中还出现了 Sonnet 4.8 和代号 Numbat 的未知模型,考虑到 Opus 4.7 的发布已经验证了泄露的准确性,这些线索值得持续关注。预测市场给 Claude 5 年底前发布的概率大约 60%,集中指向今年中期。

不过也得说说问题。4 月份大量用户反映 Opus 4.6 被悄悄降级,AMD AI 高级总监拿出近 7000 个会话的数据证明模型的读取编辑比从 6.6 暴跌到 2.0。Anthropic 承认改了默认 effort 设置但没通知用户,背后大概率是算力跟不上用户增长。这种事对信任的伤害是实打实的,Claude 5 要顺利落地,透明度必须上去。

整个 AI 竞争格局现在很有意思。顶级模型基准测试互相只差一两分,原始智能上谁也拉不开差距。但 Anthropic 在做的不仅是模型能力的提升,MCP 月下载量 9700 万次连 ChatGPT 和 Gemini 都在用,Claude Code 年化收入 25 亿美元,每天 13.5 万次 Github 提交。届时,Claude 5 的发布,接入的不只是一个模型,而是一整套已经跑通的基础设施。

相关文章

互动讨论

评论区

围绕《Anthropic 造出最强 AI 却不敢发布,Claude 5 箭在弦上》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。