AI 不够聪明?也许只是没有给对上下文!

AI 输出质量差往往不是因为模型不行,而是缺乏有效的上下文。近期备受关注的 “上下文工程” 正是解决这一瓶颈。通过数据打通、知识层构建、精准检索和运行时治理,让 AI 获取与任务真正相关的信息。在检索环节,相比基础 RAG,智能体式 RAG 能迭代获取数据,GraphRAG 靠实体关系导航提升精度,上下文压缩则过滤噪音最大化信号。当模型能力边际放缓,上下文工程的质量将成为拉开 AI 应用差距的关键。

发布于2026年5月13日 11:29
编辑小创
评论0
阅读1

很多人觉得AI不好使,第一反应是模型不行,但真正卡脖子的地方往往是上下文。模型不知道该看哪些信息、哪些跟当前任务相关,自然就会一本正经地胡说八道。

而这就是最近很火的“上下文工程”在解决的事。举个例子,你让 AI 帮你准备明天的客户会议材料,没有上下文的模型只会给你一份漂亮但空洞的通用模板。而一个上下文工程做得好的系统,会自动知道你要见谁,去拉最近的工单记录,发现续约快到期了,同时还懂得不把你权限之外的内部定价信息塞进来。输出质量的差距是巨大的,但背后的模型可能一模一样。

要做好上下文工程,核心要解决四个问题。首先是数据打通,企业数据散落在数据库、文档、SaaS 平台、各种 API 里,与其全搬到一个地方,不如用零拷贝联邦查询让 AI 在数据原地直接访问,既保证实时性又不破坏原有权限。其次是知识层的构建,原始数据本身不等于有用的上下文,需要做跨系统的实体解析,把关系和层级映射出来,让数据变成知识。第三是精准检索,“更长不等于更好”,更多上下文不等于更好的上下文,必须按意图、角色、时效去过滤,别拿无关信息干扰模型。最后是运行时治理,权限校验必须发生在检索和响应的每一步,这个智能体能不能查这个数据源、这条结果该不该返回给当前用户,都得实时判断。

在精准检索这块,视频中梳理了几种进阶方案。基础 RAG 大家都熟悉了,切块、向量化、相似度搜索,简单场景好用。智能体式 RAG 则更进一步,AI 会迭代地获取数据,第一轮觉得不够就再去拿,有点像人类做调研的过程。GraphRAG 则用图结构来导航,它关心的是实体之间的关系而非单纯的语义相似度,先通过图找到相关实体和文档,再用向量搜索填充细节,精确度高很多。还有上下文压缩技术,即使模型的上下文窗口很大,噪音多了效果照样变差,所以要对长文档做摘要和优先级排序,在有限窗口里最大化信号。

如今,模型能力的边际提升在放缓,但上下文工程的优化空间还非常大。同样的模型,喂给它的上下文质量不同,输出可以是天壤之别。接下来真正拉开差距的,是谁能把上下文这套基础设施搭得更扎实。

相关文章

三种记忆模式解决 AI 智能体的金鱼记忆
AI 新闻资讯
2026年5月12日
0 条评论
小创

三种记忆模式解决 AI 智能体的金鱼记忆

很多 AI 智能体表现“迟钝”,往往并非模型能力不足,而是缺乏记忆机制。Google 技术专家基于 ADK 提出三种解决方案:会话记忆让助手在单次对话中记住上下文;多智能体状态共享支持多个智能体通过键值对协作传递信息;持久化存储则利用数据库替代内存,使智能体能跨越重启记录用户偏好。这些方法能有效解决“金鱼记忆”问题,帮助开发者构建更连贯、具备长期服务能力的个人助理应用。

#智能体工程
阅读全文
多智能体连续工作 16 天,验证契约和串行执行是关键
智能体工程
2026年5月9日
0 条评论
小创

多智能体连续工作 16 天,验证契约和串行执行是关键

Factory 工程师 Luke 分享多智能体系统 Missions 架构,核心在于解决人的注意力瓶颈。该系统采用编排、工作、验证三角色分工,强调“先定义完成标准”再写代码,通过串行执行降低协调开销,并强制结构化交接以支撑长周期任务。不同角色匹配专用模型,编排逻辑主要依赖提示词,使团队能同时处理的工作流数量从 10 条提升至 30 条。

#智能体工程#提示词工程
阅读全文
Prompt Evolution :迭代提示词设计让多智能体性能提升 30%
智能体工程
2026年5月9日
0 条评论
小创

Prompt Evolution :迭代提示词设计让多智能体性能提升 30%

在多智能体系统中,提示词质量而非模型能力才是决定表现的关键。通过对主智能体、分析智能体、编码智能体和评判智能体提示词的系统性演进,工作流效率能够提升 30%。核心方法包括:明确智能体角色边界,将约束显式编码,将编码智能体从“作者”降格为“编译器”,以及依据失败模式驱动迭代。这一实践揭示了工业级 AI 工作流的本质。越确定性的任务越需要确定性的约束,而非期待模型自行领会意图。

#智能体工程#提示词工程
阅读全文
互动讨论

评论区

围绕《AI 不够聪明?也许只是没有给对上下文!》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。