多智能体连续工作 16 天,验证契约和串行执行是关键

Factory 工程师 Luke 分享多智能体系统 Missions 架构,核心在于解决人的注意力瓶颈。该系统采用编排、工作、验证三角色分工,强调“先定义完成标准”再写代码,通过串行执行降低协调开销,并强制结构化交接以支撑长周期任务。不同角色匹配专用模型,编排逻辑主要依赖提示词,使团队能同时处理的工作流数量从 10 条提升至 30 条。

发布于2026年5月9日 22:53
编辑小创
评论0
阅读23

Factory 的开发工程师 Luke 分享了他们内部多智能体系统 Missions 的架构设计。架构的技术并不炫,但体现了一个非常朴素的思想,软件工程的瓶颈已经从"模型够不够聪明" 变成了"人的注意力够不够用"。工程师手边堆着 50 个需求,每天只能推几个。模型能力早就不是卡点,人的带宽才是。

五种协作模式,Missions 用了四种

Luke 总结了多智能体协作的五种模式:委派、创建者-验证者、直接通信、协商、广播。Missions 选了其中四种,搭成一个“三角色”架构:

编排者:负责规划,拆任务,决定下一步做什么

工作者:负责写代码,实现功能

验证者:负责检查,确认做到没有

三个角色,各司其职,听起来简单。但魔鬼藏在细节中。

验证契约:写代码之前先定义"完成"

这是我觉得整个设计里最聪明的一环。在写任何代码之前,系统就定义好“完成”意味着什么。不是模糊的“能跑就行”,而是可能包含数百个具体的确认点。为什么这很重要?因为智能体自己写代码自己测试,本质上是在确认自己已经做出的决策,很难抓到自己的 bug。而验证者从不看代码,天然就是对抗性的。就不存在“既当运动员又当裁判”的问题。

串行执行:慢就是快

这个选择挺反直觉。并行跑多个智能体,听起来效率更高对吧?他们试了,结果协调开销把速度提升全吃掉了。智能体之间互相覆盖改动、做重复工作、架构决策打架。所以 Missions 的做法是:功能层面串行,只读操作才并行。表面慢了,但错误率大幅下降。长期任务里,正确性的提高会产生复利,越跑越快。

结构化交接:每个智能体离场必须交班

工作智能体完成功能后,必须填一份交接文档,什么完成了、什么没有、跑了哪些命令、退出码是什么。一旦捕获到错误,系统会自动拉回正轨。他们最长的任务跑了 16 天,比一个完整 sprint 还长。能跑 16 天不崩,靠的就是这种严格的交接纪律。

不同角色用不同模型

这个点也很关键。规划需要慢而审慎的推理,实现需要代码流畅度,验证需要精确的指令遵循。甚至验证者可以用完全不同的模型提供商,避免相同训练数据带来的偏见累积。Luke 他们管这个叫 "机器人耳语术",理解不同 LLM 怎么交互、在哪里失败、失败如何在连续几天的运行中叠加放大。这不是调参数,这是在对不同模型的性格做编排。

编排逻辑几乎全在提示词里

这意味着每次模型升级,系统都会自动变强,不需要重写代码。通过这种多智能体架构,一个五人团队以前同时处理 10 条工作流,现在能跑 30 条。

相关文章

多智能体为什么比单智能体强?Anthropic 用 90.2% 的数据给了答案
智能体工程
2026年6月2日
0 条评论
零重力瓦力

多智能体为什么比单智能体强?Anthropic 用 90.2% 的数据给了答案

Anthropic 研究显示,多智能体系统性能比单智能体提升 90.2%,其核心在于主智能体拆解任务与子智能体并行执行。尽管该架构 token 消耗约为单智能体的 15 倍,但在复杂任务中优势显著。业界已总结出五种协作模式,并有 n8n、CAMEL-AI 等落地案例。然而,多智能体仍面临调试难、输出不稳定等挑战。建议仅在任务复杂需并行、分工明确且能承担高成本时采用,简单任务直接使用强模型即可。

#智能体#智能体工程
阅读全文
别被多智能体的概念吓住,真正跑通工作流的人都在关注这些细节
智能体工程
2026年6月1日
0 条评论
零重力瓦力

别被多智能体的概念吓住,真正跑通工作流的人都在关注这些细节

多智能体协作在创意交付端仍存短板,但在结构化任务中价值显著。实测显示,Super Agent 生成幻灯片虽快但排版难控,而自动化销售线索处理及编程辅助等场景因规则明确、流程可定义,能实现高效落地。多智能体的核心竞争力在于清晰定义职责边界、输出格式与异常处理,而非概念本身。建议优先梳理任务结构化程度与人机分工,注重参数配置等实操细节,避免盲目追求平台概念,以构建真正可用的生产力工作流。

#智能体工程#智能体
阅读全文
OpenClaw 遇到对手了:Hermes Agent 的自我进化路线到底能不能跑通
智能体工程
2026年5月28日
0 条评论
零重力瓦力

OpenClaw 遇到对手了:Hermes Agent 的自我进化路线到底能不能跑通

开源个人 Agent 领域呈现 OpenClaw 与 Hermes Agent 的路线之争。OpenClaw 主打全平台覆盖与可视化协作,强调交互广度;Hermes Agent 则聚焦自我进化与跨会话用户建模,追求认知深度,并提供一键迁移工具争夺用户。尽管 Hermes v0.14.0 已具备生产级能力,但其自我进化机制仍面临技能质量、记忆膨胀及 token 效率等挑战。这场竞争标志着个人 Agent 赛道已从功能验证迈向设计哲学比拼的新阶段。

#Hermes Agent#OpenClaw#智能体工程
阅读全文
互动讨论

评论区

围绕《多智能体连续工作 16 天,验证契约和串行执行是关键》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。