作者:Alan Blount、Antonio Gulli、Shubham Saboo、Michael Zimmermann 和 Vladimir Vuskovic
简介
人工智能正在发生变化。多年来,人们的关注点一直在于能够胜任被动、离散任务的模型,回答问题、翻译文本,或根据提示生成图像。这种范式虽然强大,但每一步都需要人工持续引导。如今,我们正见证着范式的转变,人工智能从仅仅做出预测或生成内容,迈向能够自主解决问题和执行任务的新型软件。
这一新前沿以 AI 智能体为核心。智能体不再只是静态工作流中的 AI 模型,而是一个完整的应用程序,能够制订计划并采取行动以实现目标。它结合了语言模型(LM)的推理能力与实际行动能力,从而能够处理单一模型难以胜任的复杂多步骤任务。其关键能力在于,智能体能够自主工作,在没有人类持续引导的情况下,自行推断为达成目标所需的下一步行动。
全文
相关文章
微信 AI 智能体终于要来了
腾讯正测试微信内嵌 AI 智能体,计划将其打造为连接 14 亿月活与小程序生态的 Agent 操作系统。该产品采用端云混合架构,通过 API 直接调用小程序完成任务,兼具高效与安全优势。尽管面临模型能力与算力瓶颈,且初期或仅覆盖高频基础场景,但凭借零门槛体验和生态闭环,微信有望推动 AI Agent 大众化普及,其最终成效仍取决于模型、算力及服务调用成功率。
Windsurf 2.0 拆解:Devin 被塞进编辑器,氛围编程终于有了“调度中心”
Cognition 发布 Windsurf 2.0,深度整合 Devin 实现本地思考与云端执行分工。新版推出 Agent Command Center 支持多智能体可视化管理,搭载自研 SWE-1.5 模型大幅提升代码定位与编辑速度,并引入 Spaces 容器解决上下文延续问题。Pro 版调整为日配额制且包含 Devin 功能。相比 Cursor 3,Windsurf 2.0 凭借自研模型与云端执行能力,更适合处理陌生代码库及长任务自动化场景。
多智能体为什么比单智能体强?Anthropic 用 90.2% 的数据给了答案
Anthropic 研究显示,多智能体系统性能比单智能体提升 90.2%,其核心在于主智能体拆解任务与子智能体并行执行。尽管该架构 token 消耗约为单智能体的 15 倍,但在复杂任务中优势显著。业界已总结出五种协作模式,并有 n8n、CAMEL-AI 等落地案例。然而,多智能体仍面临调试难、输出不稳定等挑战。建议仅在任务复杂需并行、分工明确且能承担高成本时采用,简单任务直接使用强模型即可。
评论区
围绕《Google 智能体白皮书》展开交流,未登录用户可浏览评论,登录后可参与讨论。