什么是上下文工程 如何快速掌握上下文工程

上下文工程是优化大模型有限上下文窗口的关键技术,核心在于适时注入恰好的信息(如指令、记忆、工具描述等),避免干扰与幻觉。常见方法包括写入、选择、压缩和隔离上下文,本质是高效组织信息,提升智能体决策准确性与效率。

发布于2025年10月10日 06:06
编辑零重力瓦力
评论0
阅读48

随着智能体开发的兴起,你可能不止一次听到 “上下文工程” 这个词。它究竟是什么,又该如何掌握这门新的技术?这段来自 LangChain RAG 专家 Lance 的介绍,是我看过的,对 “上下文工程” 解释的最清晰,最实用的一段视频。

所谓 “上下文工程” 就是在用大模型或各种智能体时,怎么把有限的上下文窗口利用好,让模型能更聪明做事的工程技术。上下文工程的本质,就是在合适的时机、放入刚刚好的信息,让后续步骤顺利进行。

上下文这个词其实挺宽泛的,既包括最常见的 “指令”、“提示词”,也包括记忆、事实、工具介绍,甚至是外部知识。智能体的任务往往比较复杂、持续时间更长,经常要调用各种工具,还要处理多轮对话。不知不觉,上下文就变得又长又杂。这会带来各种问题,比如信息冲突、模型注意力分散、无关内容挤占空间,甚至模型开始 “幻想” 出一些莫名其妙的东西。所以,怎么挑选、组织、管理上下文,就成了特别重要的一件事。

常见的做法有几种。第一种是“写入上下文”,其实就是做笔记,把一些中间结果、计划、草稿写下来,必要时随时查阅。比如有的团队会在任务中实时记录推理过程,然后把这些关键信息保存到文件或者数据库里,后面需要的时候就能用得上。像有些聊天机器人,会自动把你的偏好、历史对话整理出来,下次交流还能记得。

第二种是 “选择上下文”,就是把哪些内容拉进来,哪些暂时先放一边,做到有的放矢。比如针对不同问题,只挑选相关的事实、规章、案例,或者用嵌入、知识图谱等方式,从大堆信息里检索最有用的部分。不要让 LLM 在迷失在大量低相关的信息中。

当上下文真的太多,空间又有限时,就需要用到第三种方法 “压缩上下文”。最常见的就是做摘要,把多轮对话、历史数据浓缩成一小段,把关键点提炼出来。或者直接删减,只保留最近几轮、最有用的信息。这样不仅节省空间,还能减少模型混淆的可能。

最后一种方法就是 “隔离上下文”,比如在多智能体系统中,每个智能体各管一摊,谁负责什么主题、用什么工具、处理什么数据,都有自己的 “小黑屋”,互不干扰。这样做的好处是可以并行处理多项任务,还能让每个智能体专注自己的部分。等到需要协作时,再把必要的信息汇总给最终的大模型。

其实这些做法,和我们人类的团队协作、做笔记、查资料很像。归根结底,上下文工程就是在有限的空间里,把信息组织得更加井井有条,让智能体(或者说自动化系统)能少走弯路,做出更靠谱的决策。

相关文章

JetBrains Junie 正式版:AI 编程 Agent 学会了用调试器断点
AI 编程开发
2026年6月19日
0 条评论
零重力瓦力

JetBrains Junie 正式版:AI 编程 Agent 学会了用调试器断点

JetBrains AI 编程 Agent Junie 正式 GA,在 SWE-Rebench 基准测试中排名第一。其核心优势在于深度集成 IDE 原生工具链,而非模拟替代。主要特性包括:Plan 模式生成结构化计划文档以防跑偏;原生调试器集成支持断点与运行时状态检查;支持异步远程控制长任务;基于项目上下文的交互式代码审查;以及模型自由切换以优化成本。Junie 标志着 AI 编程竞争正从模型能力转向工具集成深度。

#智能体#AI 编程
阅读全文
Visa 把支付网络接进了 ChatGPT,AI 智能体终于能自己花钱了
AI 新闻资讯
2026年6月18日
0 条评论
零重力瓦力

Visa 把支付网络接进了 ChatGPT,AI 智能体终于能自己花钱了

Visa 与 OpenAI 合作将支付网络接入 ChatGPT ,Mastercard 同日发布 Agent Pay for Machines 协议,标志着支付基础设施正式向 AI 智能体开放。Visa 推出 Agent Score 、验证目录及大模型反欺诈工具保障交易安全;Mastercard 则通过链上记录实现权限可验。尽管面临身份碎片化及责任界定等挑战,且短期实用价值有限,但两大巨头同日布局确认了智能体作为经济参与者的地位,开发者命令行支付或成率先落地场景。

#智能体
阅读全文
Google 搜索变身全天候智能体:Information Agents 上线,你的数据终于开始替你干活了
AI 产品工具
2026年6月15日
0 条评论
零重力瓦力

Google 搜索变身全天候智能体:Information Agents 上线,你的数据终于开始替你干活了

Google 推出 Information Agents 功能,面向 AI Ultra 订阅用户开放。该功能将搜索从被动查询转变为主动监测,智能体可 7×24 小时追踪用户需求并推送变化信息。其底层依托 Personal Intelligence 战略,通过整合 Gmail、Photos 等跨应用数据实现个性化推理。尽管存在隐私与准确性挑战,但凭借二十年数据积累,Google 正推动 AI 助手从对话工具向自主代理进化,重塑“信息找人”的交互范式。

#Google#智能体
阅读全文
互动讨论

评论区

围绕《什么是上下文工程 如何快速掌握上下文工程》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。