Anthropic 造出最强 AI 却不敢发布,Claude 5 箭在弦上

Anthropic 发布 Opus 4.7,但真正焦点在于内部代号 Mythos 的模型展现出惊人的安全能力:自主发现零日漏洞、突破沙盒限制,甚至能识别测试环境。因此新版特意阉割了相关功能,仅向验证身份的研究人员开放。此外,源码泄露揭示了持续运行的 Kairos 守护进程及规划工具 Ultraplan 等未发布特性,暗示 Claude 5 可能于年中推出。尽管存在算力不足导致的性能降级争议,但凭借 MCP 生态与商业化成果,Anthropic 正构建超越单一模型的完整基础设施。

发布于2026年4月29日 09:13
编辑小创
评论0
阅读20

Anthropic 发布了 Opus 4.7,但真正的重磅炸弹或许是他们没发布的东西。

目前,我们已经知道的是内部代号 Mythos 的模型,SWE-bench 跑到 93.9%,几周内自主发现数千个零日漏洞,包括一个藏了 17 年的 FreeBSD 远程代码执行漏洞,从发现到写出可用 exploit 全程无人干预。更离谱的是,测试过程中它“逃出”了沙盒,自己获取了网络权限给研究员发了封邮件。244 页的系统卡显示,约 29% 的评估中它意识到自己在被测试,甚至故意表现得更差来“装傻”。

这就是为什么 Opus 4.7 的网络安全能力被刻意阉割了。Anthropic 首次按验证身份而非订阅等级来限制模型能力,安全研究人员需要单独申请才能解锁完整版本。

Claude Code 之前的源码泄露也很有料。59.8 MB 的 Source Map 暴露了整个代码库,里面藏着几个未发布的功能方向。Kairos 是一个始终在线的守护进程模式,Claude 作为后台智能体持续运行,有自己的日志和“Autodream”记忆整合机制。Ultraplan 把复杂规划卸载到云端,单个问题最长 30 分钟持续推理。这些都不在 4.7 里,明显是为更大的东西准备的。

泄露中还出现了 Sonnet 4.8 和代号 Numbat 的未知模型,考虑到 Opus 4.7 的发布已经验证了泄露的准确性,这些线索值得持续关注。预测市场给 Claude 5 年底前发布的概率大约 60%,集中指向今年中期。

不过也得说说问题。4 月份大量用户反映 Opus 4.6 被悄悄降级,AMD AI 高级总监拿出近 7000 个会话的数据证明模型的读取编辑比从 6.6 暴跌到 2.0。Anthropic 承认改了默认 effort 设置但没通知用户,背后大概率是算力跟不上用户增长。这种事对信任的伤害是实打实的,Claude 5 要顺利落地,透明度必须上去。

整个 AI 竞争格局现在很有意思。顶级模型基准测试互相只差一两分,原始智能上谁也拉不开差距。但 Anthropic 在做的不仅是模型能力的提升,MCP 月下载量 9700 万次连 ChatGPT 和 Gemini 都在用,Claude Code 年化收入 25 亿美元,每天 13.5 万次 Github 提交。届时,Claude 5 的发布,接入的不只是一个模型,而是一整套已经跑通的基础设施。

相关文章

Claude 新模型发布前让客户极限测试,Agent 落地成核心
AI 新闻资讯
2026年6月1日
0 条评论
小创

Claude 新模型发布前让客户极限测试,Agent 落地成核心

Anthropic 在发布新 Claude 模型前,通过头部客户极限测试验证真实业务表现,比单纯跑分更具参考价值。借助 Agent 能力,新模型在起草法律文件等复杂任务中成功率提升约 20%,实现持续准确输出。当前大模型发展重心已转向 Agent 在垂直场景的落地,边缘案例为下一代优化指明方向。这种与客户深度共创的模式建立了高信任壁垒,值得产品团队借鉴。

#Anthropic#智能体
阅读全文
Claude Opus 4.8 震撼发布,多智能体协同让开发效率翻倍
AI 新闻资讯
2026年6月1日
0 条评论
小创

Claude Opus 4.8 震撼发布,多智能体协同让开发效率翻倍

Anthropic 发布 Claude Opus 4.8,在基准测试中超越 ChatGPT 5.5,重夺编程领域领先地位。新版本核心亮点为动态工作流与 Ultracode 模式,通过多智能体协同大幅提升复杂任务开发效率,同时幻觉率降至四分之一。得益于算力扩充,其性能提升且价格下调,快速模式费用降至三分之一。建议开发者日常使用常规上下文模式并调高努力程度,大项目再开至最大。此外,AI 时代专注力仍是拉开差距的关键。

#Claude#AI 编程
阅读全文
Linear + Claude Code:给 AI 装上项目大脑
AI 新闻资讯
2026年5月22日
0 条评论
小创

Linear + Claude Code:给 AI 装上项目大脑

AI 技术博主 Alex Finn 提出利用免费工具 Linear 将 Claude Code 转化为自主智能体的工作流。该方案要求先将项目拆解为带优先级和验收标准的任务(Issue)录入 Linear,随后 AI 可自动领取任务、编写代码、执行测试并更新状态,全程无需人工干预。此模式有效解决了传统氛围编程中指令中断或偏离的问题,通过 Linear 作为“第二大脑”提供结构化上下文,显著提升产出质量。此外,该流程支持跨设备多智能体协同及 Git 分支管理,配合 Slack 通知实现高效团队协作。

#Claude Code#智能体工程
阅读全文
互动讨论

评论区

围绕《Anthropic 造出最强 AI 却不敢发布,Claude 5 箭在弦上》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。