LangSmith Engine 让 Agent 改进从人肉巡检变成自动闭环

LangChain 推出 LangSmith Engine,将智能体(Agent)的改进流程从手动转变为自动化闭环。针对 Agent 开发中追踪数据庞大、人工排查低效的痛点,LangSmieth Engine 引擎能够自动扫描追踪记录,识别报错、评估失败及用户负反馈等问题,并通过模式匹配聚合同类 Issue 进行优先级排序。基于代码仓库关联,它还能自动生成修复 PR,并创建自定义在线评估器以持续监控问题复发,同时将生产数据纳入离线评估套件防止回归。这一机制实现了“发现问题、修复问题、防止回归”的全自动链路,显著缩短开发周期。

发布于2026年5月22日 13:55
编辑小创
评论0
阅读20

LangChain 发布了 LangSmith Engine,把智能体的改进闭环从手动变成自动化。

做过 Agent 开发的都知道,数据追踪(traces)大家都有,但真正痛苦的是从海量 trace 里找到问题、定位原因、修复、写测试防回归,这套流程全靠人肉,慢且有盲区。LangSmith Engine 就是接管这个过程。

它会自动扫描你的追踪记录,盯住显式报错、在线评估失败、用户负反馈、以及 Agent 没处理好的新场景。发现问题后在整个项目里做模式匹配,把同类问题聚合成一个 issue,按严重程度和频率排优先级。

更有意思的是后面的动作。因为关联了代码仓库,Engine 会直接起草一个 PR,可能是改 prompt,也可能是改代码,你审查合并就行。同时它还会为这个具体问题生成一个自定义在线评估器持续监控,问题复发会自动浮现。最后把相关的生产 trace 加入标注数据集,纳入离线评估套件防回归。

整个链路就是“发现问题 → 修复问题 → 防止回归”的完整自动化闭环。Cogent 和 Campfire 等团队已经在用,解决了影响数千条 trace 的问题。

Agent 开发到了现阶段,瓶颈已经从“能不能跑起来”转移到了“怎么持续提升质量”,谁能把改进循环压缩得更短,谁的 Agent 就能更快变好。LangSmith Engine 本质上是把 SRE 的思路搬到了 Agent 运维里,用自动化观测加闭环修复替代人工巡检。

相关文章

拜耳用 3 层反思循环把 AI 拉进制药生产线:上下文工程和 harness 工程到底在干什么
智能体工程
2026年6月21日
0 条评论
零重力瓦力

拜耳用 3 层反思循环把 AI 拉进制药生产线:上下文工程和 harness 工程到底在干什么

拜耳制药和 Thoughtworks 在 Martin Fowler 的博客上发表了一篇完整案例,讲他们花了两年多时间把 PRINCE(Preclinical Information Center)从关键词搜索工具演变成多智能体 RAG 系

#智能体工程
阅读全文
微软 Mirage:让世界模型学会“过目不忘”,速度快 10 倍、显存省 55 倍
AI 产品工具
2026年6月21日
0 条评论
零重力瓦力

微软 Mirage:让世界模型学会“过目不忘”,速度快 10 倍、显存省 55 倍

微软研究院联合多所高校发布 Mirage 模型,通过在扩散模型隐空间直接存储三维记忆,解决了 AI 视频生成中场景一致性差及计算昂贵的问题。该方案摒弃传统 RGB 点云渲染流程,使生成速度提升最高 10.57 倍,显存占用降低 55 倍,且长视频边际成本几乎不增。测试显示其三维与光度一致性优于现有方案,虽暂不支持动态物体记忆,但已开源并适用于机器人仿真等静态场景任务。

#世界模型
阅读全文
Vercel 发布 eve 开源智能体框架:Agent 界的 Next.js 终于来了
智能体工程
2026年6月18日
0 条评论
零重力瓦力

Vercel 发布 eve 开源智能体框架:Agent 界的 Next.js 终于来了

Vercel 发布开源智能体框架 eve,采用文件系统优先设计,将 Agent 定义为目录结构以降低理解成本。框架内置持久化会话、沙盒计算、人类审批、安全连接、多渠道部署及可观测性六大生产级能力,解决重复造轮子痛点。eve 目前处于公开预览阶段,框架免费但托管服务收费。该框架标志着 AI Agent 开发正从混乱走向标准化,大幅缩短从 demo 到上线的距离,但需注意 beta 阶段的 API 变动及供应商锁定风险。

#智能体框架#智能体工程
阅读全文
互动讨论

评论区

围绕《LangSmith Engine 让 Agent 改进从人肉巡检变成自动闭环》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。