提示词工程已死,上下文工程崛起:Karpathy 最新演讲透露的信号

4 月 30 日,Karpathy 在 Sequoia Ascent 2026 提出 Software 3.0 概念,指出 2025 年 12 月已成为 Agentic 拐点。核心变化在于工作流从编写代码转向编排 Agent,上下文窗口成为新程序杠杆。他强调 AI 落地速度取决于场景是否具备自动化验证信号,而非单纯模型能力。开发者应关注任务的可验证性与训练数据分布,普通用户则需尝试将完整宏观任务交付给 Agent。

发布于2026年5月5日 17:16
编辑零重力瓦力
评论0
阅读3

4月30日,Karpathy 在 Sequoia Ascent 2026 做了一个炉边谈话,标题叫 "Software 3.0"。这个演讲的信息密度相当高,而且说出了几句相当有冲击力的话。

他说,2025 年 12 月是一个 "Agentic 拐点"。

不是模型突然变聪明了,而是默认工作流变了。以前你写代码,是一行一行敲进去。现在你把一个完整任务丢给 Agent,它自己写、自己跑测试、自己修 bug。单位从 "代码行" 变成了 "宏观动作":“实现这个功能”、“重构这个子系统”、“研究这个库”。

这意味着什么?程序员从代码撰写者变成了 Agent 编排者。

上下文窗口就是新的程序

Karpathy 把这个趋势定义为 Software 3.0

1.0:人类写显式代码 2.0:人类造数据集、目标函数,程序通过权重学习 3.0:人类通过提示词、上下文、工具、示例、记忆和指令来编程 LLM

在这个范式里,Context Window 变成了主要杠杆。你给 Agent 一段指令,Agent 读取本地环境,debug 错误,适配机器,完成设置,整个过程是一个可以在任意环境中运行的"程序"。它不够精确,但足够自适应。

这其实就是"上下文工程"的本质:不是优化 prompt 的措辞,而是设计整个上下文的结构,让 LLM 作为解释器在其上执行计算。

可验证性决定了 AI 落地速度

Karpathy 给了一个核心自动化框架:

  1. 传统软件自动化:"你能描述清楚的东西"
  2. LLM 和强化学习自动化:"你能验证结果的东西"

代码为什么落地最快?因为测试会通过或失败,程序会跑或崩,diff 可以审查,benchmark 可以测量。反馈是自动化的。

这个逻辑反过来也成立:为什么很多创意类任务 AI 表现平庸?因为没有自动化的成功信号。AI 无法知道自己"做得好不好",除非你人工介入。

所以真正的问题不是"AI 能做什么",而是"你的场景是否能产生自动化验证信号"。

普通人能怎么用

如果你在用 AI 编程工具:把更大、更完整的任务丢给 Agent,不要停留在单行 prompt 层面。信任度可以更高一点了,2025 年 12 月之后的工具已经比之前可靠得多。

如果你在做 AI 产品:先问自己一个问题,我的任务是否可验证?如果答案是否定的,你可能需要人工反馈循环,或者至少是一套人工评估流程。不要指望模型自己学会"做好"一件没有奖励信号的事。

开发者值得关注的点

模型的能力不是均匀分布的。Karpathy 提出了一个公式:能力跃迁 = 可验证性 × 训练注意力 × 数据覆盖面 × 经济价值。

你的任务场景在模型的哪条轨道上?如果正好在训练密集区,模型表现会远超预期。如果不在,结果可能让人失望。这就是为什么同一个模型在不同任务上表现差异巨大。这不是模型缺陷,是训练信号分布不均的结果。

相关文章

2026 年提示词工程的十大技术家族与实战心法
提示词工程
2026年5月5日
0 条评论
零重力瓦力

2026 年提示词工程的十大技术家族与实战心法

提示词技术清单已近百种,死记硬背不如掌握“何时用”。文章将技巧归纳为十大家族:设定、结构、示例决定输入,推理、分解引导思考,检索、智能体连接外部世界,验证、约束、元处理保障可靠性。生产级提示词通常组合多个家族,先诊断问题所属家族再选具体手法,比盲目尝试更高效。

#提示词工程#上下文工程#智能体
阅读全文
代码 Agent 的上下文减肥药:SWE-Pruner 是怎么让模型少看多想的
提示词工程
2026年5月5日
0 条评论
零重力瓦力

代码 Agent 的上下文减肥药:SWE-Pruner 是怎么让模型少看多想的

针对代码 Agent 上下文昂贵且易迷失的痛点,SWE-Pruner 提出模仿人类“选择性略读”的策略。该方案通过任务目标引导剪枝,利用 0.6B 小模型动态筛选关键代码片段,而非依赖破坏语法的固定指标。实测显示,其在 SWE-Bench 等任务中 Token 消耗降低 23% 至 54%,成功率反而提升。这一思路为长代码处理提供了新方向,尤其适合需要本地部署或边缘计算的 Agent 落地场景。

#上下文工程#智能体
阅读全文
AI 研究实验室 NeoCognition 获 4000 万美元种子轮融资,构建类人学习智能体
AI 新闻资讯
2026年5月4日
0 条评论
小创

AI 研究实验室 NeoCognition 获 4000 万美元种子轮融资,构建类人学习智能体

NeoCognition 由俄亥俄州立大学教授 Yu Su 创立,获 4000 万美元种子轮融资。团队约 15 人,多为博士,目标不是解决智能体做事不稳定的致命短板!当前智能体任务成功率仅约 50%。公司试图打造能自我学习、快速专业化的智能体系统,让 AI 进入任何领域后都能自主构建“世界模型”,成为真正的“专家”。投资方包括 Vista Equity Partners 等重量级机构, NeoCognition 计划将产品卖给企业客户,特别是 SaaS 公司。融资背后反映 AI 市场正从追逐“大模型”转向追求“更可靠的执行”。

#智能体
阅读全文
互动讨论

评论区

围绕《提示词工程已死,上下文工程崛起:Karpathy 最新演讲透露的信号》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。