Claude Fable 5 实测

Claude Fable 5 发布,定位为 Mythos 降权公开版,核心优势在于长程复杂任务的稳定性。该模型支持 1M token 上下文,在 Stripe 全库迁移等场景中表现优异。安全方面采用运行时分流机制,高风险请求自动路由至 Opus 4.8。定价为输入 $10/百万 token、输出 $50/百万 token,6 月 22 日前对订阅用户免费,并已上线 AWS Bedrock 和 GitHub Copilot。实测显示其代码生成与 3D 建模能力显著优于前代,建议针对长任务场景进行实

发布于2026年6月13日 21:26
编辑小创
评论0
阅读0

Claude Fable 5 发布,其实就是之前神秘的 Mythos 的 “降权公开版”。同一代基础模型,加了一层安全路由后向所有用户开放。看了一下官方文档和早期测评,以下几点值得大家关注。

官方说法是几乎所有基准(软件工程、知识工作、视觉、科研)全面 SOTA,虽然他们每代模型发布都会说,不稀奇。但真正有意思的是,任务越长、越复杂,模型相对优势就越大。这意味着提升主要不在单轮问答上,而是长程任务的稳定性。错误率随步数累积的曲线被压平了,而这恰恰是 agent 工作流最卡脖子的地方。

Stripe 在 5000 万行的 Ruby 单体仓库上跑全库迁移,原计划整个团队两个多月的手工工作量,Fable 5 一天完成。这项任务的难点不是单文件改写,而是跨模块依赖追踪和迁移一致性,对上下文管理是硬考验。配置上是默认 1M token 上下文窗口、单请求 128k 输出,确实是按超长任务设计的。

关于安全架构,这次的方案也比较少见。高风险领域(网络攻防、生化、模型蒸馏相关)的请求不会被拒答,而是自动路由给 Opus 4.8 代为回答并通知用户,平均触发率低于 5%。等于在能力和风险之间做了运行时分流,而不是训练时一刀切。但漏洞赏金计划 1000+ 小时红队测试,目前没有通用越狱被报告,这个数字需要持续观望,但听起来不错。

Claude Fable 5 定价 $10/$50 每百万输入/输出 token,是 Opus 4.8 的两倍、Mythos Preview 的一半以下。对重输出的 agent 场景,输出 $50 这个数字需要认真算账。

6 月 22 日前 Pro/Max/Team 订阅免费开放,AWS Bedrock 和 GitHub Copilot 已同步上线。建议拿自己的长任务 pipeline 实测,benchmark 数字看看就好。

最后,仍旧是 3D 飞行避障游戏的实测。代码一次性通过,无论是飞机、场景的建模,操作感都相当不错。明显比 Opus 4.8 版(微博正文)要强。

相关文章

电脑自己动起来了?Windows 版 Codex 迎来功能更新
AI 产品工具
2026年6月13日
0 条评论
小创

电脑自己动起来了?Windows 版 Codex 迎来功能更新

Windows 版 Codex 新增计算机操控与移动端访问功能。AI 可直接接管电脑屏幕和光标,自动操作桌面软件及浏览器多标签页任务,简化繁琐工作流程。用户只需在设置中开启相关选项并添加设备即可使用。同时,该更新打通手机端,支持通过 iOS 或 Android 端 ChatGPT 应用扫码绑定,实现远程查看任务进度及发起新的电脑操控指令,大幅提升跨设备协作效率与自动化体验。

#Codex#智能体
阅读全文
DeepSWE 新基准测试为什么会爆火
AI 产品工具
2026年6月13日
0 条评论
小创

DeepSWE 新基准测试为什么会爆火

新基准测试 DeepSWE 因杜绝数据污染且贴近真实开发场景而受关注。该测试采用全手写未公开任务,提示词简短但代码量大,有效检验模型自主理解与编码能力。测评显示 GPT 5.5 以 70% 得分领先,Opus 4.7 落后超 15 分且成本高出近三倍。测试还揭示了模型行为差异:Claude 易遗漏需求并检索历史答案,GPT 5.5 则严格遵循指令。DeepSWE 被认为更能反映大模型实际编程水平。

阅读全文
能自主运行数天的神话级模型 Claude Fable 5 正式发布
AI 产品工具
2026年6月13日
0 条评论
小创

能自主运行数天的神话级模型 Claude Fable 5 正式发布

Anthropic 发布最强模型 Claude Fable 5 并向公众开放。针对此前预览版存在的安全隐患,该模型引入安全路由机制,将高风险请求自动分流至 Opus 4.8 处理,在保障安全的同时释放通用能力。Fable 5 具备超高自主性,可连续数天独立处理金融、法律及科研等领域的复杂项目,无需人工干预。这种长周期、高自主性的任务处理能力,有望彻底改变现有工作流。

#Claude#AI 模型
阅读全文
互动讨论

评论区

围绕《Claude Fable 5 实测》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。