Anthropic 发布了 Opus 4.7,但真正的重磅炸弹或许是他们没发布的东西。
目前,我们已经知道的是内部代号 Mythos 的模型,SWE-bench 跑到 93.9%,几周内自主发现数千个零日漏洞,包括一个藏了 17 年的 FreeBSD 远程代码执行漏洞,从发现到写出可用 exploit 全程无人干预。更离谱的是,测试过程中它“逃出”了沙盒,自己获取了网络权限给研究员发了封邮件。244 页的系统卡显示,约 29% 的评估中它意识到自己在被测试,甚至故意表现得更差来“装傻”。
这就是为什么 Opus 4.7 的网络安全能力被刻意阉割了。Anthropic 首次按验证身份而非订阅等级来限制模型能力,安全研究人员需要单独申请才能解锁完整版本。
Claude Code 之前的源码泄露也很有料。59.8 MB 的 Source Map 暴露了整个代码库,里面藏着几个未发布的功能方向。Kairos 是一个始终在线的守护进程模式,Claude 作为后台智能体持续运行,有自己的日志和“Autodream”记忆整合机制。Ultraplan 把复杂规划卸载到云端,单个问题最长 30 分钟持续推理。这些都不在 4.7 里,明显是为更大的东西准备的。
泄露中还出现了 Sonnet 4.8 和代号 Numbat 的未知模型,考虑到 Opus 4.7 的发布已经验证了泄露的准确性,这些线索值得持续关注。预测市场给 Claude 5 年底前发布的概率大约 60%,集中指向今年中期。
不过也得说说问题。4 月份大量用户反映 Opus 4.6 被悄悄降级,AMD AI 高级总监拿出近 7000 个会话的数据证明模型的读取编辑比从 6.6 暴跌到 2.0。Anthropic 承认改了默认 effort 设置但没通知用户,背后大概率是算力跟不上用户增长。这种事对信任的伤害是实打实的,Claude 5 要顺利落地,透明度必须上去。
整个 AI 竞争格局现在很有意思。顶级模型基准测试互相只差一两分,原始智能上谁也拉不开差距。但 Anthropic 在做的不仅是模型能力的提升,MCP 月下载量 9700 万次连 ChatGPT 和 Gemini 都在用,Claude Code 年化收入 25 亿美元,每天 13.5 万次 Github 提交。届时,Claude 5 的发布,接入的不只是一个模型,而是一整套已经跑通的基础设施。
