赋能 AI 智能体搜索:获取大语言模型最佳结果

MIT CSAIL 与 Asari AI 联合研发 EnCompass 框架,专为解决大语言模型在代码迁移等任务中的错误恢复难题。该框架通过分支点标注机制,将搜索策略与 AI 智能体工作流程解耦,实现自动化的回溯与并行尝试。实测显示可削减 80%的搜索功能实现工作量,准确率提升 15%至 40%,使开发者无需编写冗长回溯逻辑即可高效构建 AI 辅助软件开发系统。

发布于2026年4月18日 23:40
编辑小创
评论0
阅读14

MIT 与 Asari AI 联合推出 EnCompass 框架:让 AI 智能体编程效率提升 80%

当软件开发团队试图借助大语言模型将遗留代码库迁移至现代编程语言时,往往会遭遇一个棘手的问题:大语言模型并非完美无缺,一旦模型输出错误结果,整个自动化流程便可能陷入僵局。传统解决方案要求开发者手动编写大量回溯逻辑,其代码量甚至可能逼近原始智能体本身。这正是 MIT 计算机科学与人工智能实验室( CSAIL )与 Asari AI 的研究人员试图破解的核心痛点。

一个名为“EnCompass”的框架近日正式亮相。该框架能够自动管理 AI 智能体程序中的回溯与并行尝试机制,使开发者无需再为错误恢复逻辑投入冗长的编码工作。研究团队的测试数据显示, EnCompass 在代码翻译与数字网格转换规则发现等任务中,将搜索功能的实现工作量削减了至多 80%。

“我们在 EnCompass 中实现的核心思想,是将搜索策略与 AI 智能体的底层工作流程彻底解耦。”该论文第一作者、 MIT 电气工程与计算机科学系博士研究生、 CSAIL 研究员 Zhening Li 解释道,“开发者可以轻松尝试不同的搜索策略,从中找出令智能体表现最优的那一个。”

具体而言, EnCompass 允许用户通过“分支点”( branchpoints )标注标记那些可能产生不同结果的操作——通常是调用大语言模型的环节。这些标注将原本单一线性的程序转化为可供探索的“分支叙事”,系统随后依据预设的搜索策略在这些分支中导航,以期找到最佳解决方案。用户既可直接使用 EnCompass 内置的搜索策略,也可根据具体需求编写自定义策略,例如蒙特卡洛树搜索或束搜索。

在针对 Java 代码库向 Python 迁移任务的实验中,研究人员发现使用 EnCompass 仅需额外编写约 348 行代码,相比手工实现减少了约 82%。当采用两层束搜索算法时,系统在 5 个不同代码仓库上的准确率实现了 15%至 40%的提升。

该研究的另一位合著者、 MIT 教授 Armando Solar-Lezama 指出,随着大语言模型在日常软件开发中扮演的角色日益重要,理解如何高效构建能够发挥其优势、规避其局限的软件系统变得愈发关键。“EnCompass 正是朝这个方向迈出的重要一步。”

研究团队透露,下一步计划将 EnCompass 扩展为更通用的 AI 智能体搜索框架,并在更复杂的实际任务中进行测试,包括大型代码库管理、科学实验设计与执行,以及火箭与其他硬件的蓝图创建等场景。

该研究成果已在 2024 年 12 月的神经信息处理系统大会( NeurIPS )上正式发表。

创艺洞察

EnCompass 的出现折射出一个正在演进的技术趋势:随着 AI 智能体逐步从实验性工具走向生产级应用,如何降低其编程门槛、提升开发效率已成为行业亟需解决的问题。将搜索策略与工作流程解耦的设计思路颇具启发性。它本质上是在为 AI 智能体构建一套可插拔的“决策引擎”,让开发者能够专注于业务逻辑本身,而非深陷于错误恢复与路径探索的泥潭。这一框架若能在实际工程场景中经受住考验,有望成为 AI 辅助软件开发工具链中的关键一环。

相关文章

Mistral 把编程 Agent 扔进云里
AI 编程开发
2026年5月12日
0 条评论
零重力瓦力

Mistral 把编程 Agent 扔进云里

Mistral 推出 Medium 3.5 开源模型与 Vibe 远程代理,将编程协作从“人机同步”转向“异步委派”。128B 稠密模型以 77.6% 的 SWE-Bench 成绩超越 Claude Sonnet 4,支持自部署。Vibe 允许开发者在云端沙箱并行运行多个任务,自动提交 PR 并通知审查。配合 Le Chat 通用工作模式,该方案适合追求效率的团队及关注数据安全的独立开发者,重新定义了 AI 辅助编码的工作流。

#Mistral#开源模型#AI 编程
阅读全文
如何解决 Hermes Agent 中 QQ Bot “灵魂不在线”
AI 教程知识
2026年5月8日
0 条评论
零重力瓦力

如何解决 Hermes Agent 中 QQ Bot “灵魂不在线”

Hermes QQ Bot 常因网络波动出现“灵魂不在线”的静默断连,根源在于 WebSocket 重连逻辑缺陷导致进程未正常退出。目前修复版本已解决重连耗尽问题,但深层异常捕获仍有待完善。建议用户升级至最新版,配置 systemd 或 Docker 自动重启策略,并优化代理超时设置,以保障 QQ Bot 稳定运行。

#Hermes Agent
阅读全文
一个 JSON 公式,让 AI 出图告别抽卡玄学
AI 教程知识
2026年5月8日
0 条评论
小创

一个 JSON 公式,让 AI 出图告别抽卡玄学

AI 技术博主 AI Master 提出用 JSON 结构化提示词替代自然语言,解决 AI 绘图修改局部时整体崩坏的问题。该方法将主体、灯光等元素独立分槽,配合 Gemini 提取参考图信息,可实现精准调整颜色或风格而不影响其他细节。此方案适用于角色一致性控制及摄影参数迁移,同样兼容 Veo 3.1 视频生成,让 AI 创作从随机抽卡转向可控的确定性系统。

#Veo#Nano Banana#提示词工程
阅读全文
互动讨论

评论区

围绕《赋能 AI 智能体搜索:获取大语言模型最佳结果》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。