Anthropic 为 Claude 平台 API 用户推出智能顾问工具

Anthropic 在 Claude 平台推出顾问工具,让 Opus 模型担任“顾问”,配合 Sonnet 或 Haiku 作为“执行器”。执行器独立处理日常任务,遇复杂决策时自动升级求助,实现高级推理与成本控制的平衡。测试数据显示, Haiku 配合 Opus 顾问后性能提升一倍以上,成本显著低于单独运行 Sonnet 。这一“小模型执行+大模型顾问”模式正成为智能体开发的主流架构。

发布于2026年4月11日 12:17
编辑小创
评论0
阅读32

Anthropic 为 Claude 平台 API 用户推出顾问工具

Anthropic 正式在 Claude 平台上推出顾问工具( advisor tool )。这款工具允许开发者将 Opus 模型定位为“顾问”,配合 Sonnet 或 Haiku 作为“执行器”使用。通过这一策略,智能体能够获取高级推理能力,同时将运营成本维持在高效执行器的水平。开发者只需在 Messages API 请求中完成简单配置,即可启用该功能。该工具主要面向需要在成本控制与高级推理之间取得平衡的智能体开发者与组织。

具体运作机制如下: Sonnet 或 Haiku 负责独立处理日常任务;当这些执行器遇到需要复杂判断的决策点时,系统自动向 Opus 发起调用。 Opus 接收共享上下文信息后,返回规划方案或修正建议,执行器随后继续推进任务。这一模式与传统系统形成鲜明对比——后者通常由大模型全程统筹并向子智能体分发任务,而顾问工具则让执行器在必要时才升级求助,其余操作均保持在较低成本区间。

技术评估数据显示,搭载 Opus 顾问后,多项基准测试表现均有提升,包括 SWE-bench Multilingual 、 BrowseComp 以及 Terminal-Bench 2.0 。以 Haiku 为例,配合 Opus 顾问使用时,基准得分提升一倍以上,而整体成本显著低于单独运行 Sonnet 。

Anthropic 致力于开发高可靠性和高效率的先进 AI 系统。此次发布再次体现了公司帮助开发者在规模化部署智能体时控制成本的决心。随着大模型推理成本持续下降,“小模型执行+大模型顾问”的组合策略正逐渐成为行业主流架构。

相关文章

微软 Mirage:让世界模型学会“过目不忘”,速度快 10 倍、显存省 55 倍
AI 产品工具
2026年6月21日
0 条评论
零重力瓦力

微软 Mirage:让世界模型学会“过目不忘”,速度快 10 倍、显存省 55 倍

微软研究院联合多所高校发布 Mirage 模型,通过在扩散模型隐空间直接存储三维记忆,解决了 AI 视频生成中场景一致性差及计算昂贵的问题。该方案摒弃传统 RGB 点云渲染流程,使生成速度提升最高 10.57 倍,显存占用降低 55 倍,且长视频边际成本几乎不增。测试显示其三维与光度一致性优于现有方案,虽暂不支持动态物体记忆,但已开源并适用于机器人仿真等静态场景任务。

#世界模型
阅读全文
JetBrains Junie 正式版:AI 编程 Agent 学会了用调试器断点
AI 编程开发
2026年6月19日
0 条评论
零重力瓦力

JetBrains Junie 正式版:AI 编程 Agent 学会了用调试器断点

JetBrains AI 编程 Agent Junie 正式 GA,在 SWE-Rebench 基准测试中排名第一。其核心优势在于深度集成 IDE 原生工具链,而非模拟替代。主要特性包括:Plan 模式生成结构化计划文档以防跑偏;原生调试器集成支持断点与运行时状态检查;支持异步远程控制长任务;基于项目上下文的交互式代码审查;以及模型自由切换以优化成本。Junie 标志着 AI 编程竞争正从模型能力转向工具集成深度。

#智能体#AI 编程
阅读全文
Visa 把支付网络接进了 ChatGPT,AI 智能体终于能自己花钱了
AI 新闻资讯
2026年6月18日
0 条评论
零重力瓦力

Visa 把支付网络接进了 ChatGPT,AI 智能体终于能自己花钱了

Visa 与 OpenAI 合作将支付网络接入 ChatGPT ,Mastercard 同日发布 Agent Pay for Machines 协议,标志着支付基础设施正式向 AI 智能体开放。Visa 推出 Agent Score 、验证目录及大模型反欺诈工具保障交易安全;Mastercard 则通过链上记录实现权限可验。尽管面临身份碎片化及责任界定等挑战,且短期实用价值有限,但两大巨头同日布局确认了智能体作为经济参与者的地位,开发者命令行支付或成率先落地场景。

#智能体
阅读全文
互动讨论

评论区

围绕《Anthropic 为 Claude 平台 API 用户推出智能顾问工具》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。