追求 Token 最大化:反而让开发者效率降低

AI 编程工具虽大幅提升代码产出量,但质量堪忧。数据显示 AI 生成代码的实际有效接受率仅 10%-30%,代码“搅动率”是非 AI 用户的 9 倍以上。问题根源在于当前效率指标仅衡量投入(如 Token 预算)而非产出,导致开发者追逐体量而非价值。初级工程师因缺乏经验更容易直接接受 AI 代码,后续重写成本更高。业界已意识到这一指标陷阱,工程效能分析工具和企业收购动作相继出现,但 AI 编程趋势不可逆转,开发者需适应这一新范式。

发布于2026年4月18日 15:45
编辑小创
评论0
阅读20

AI 写的代码,正在被大量删掉

衡量什么,就会得到什么,这句管理学老话,正在 AI 编程时代遭遇一次尴尬的现实检验。

各家工程效能分析公司的数据,讲述的是同一个故事: AI 工具确实让代码产出量大幅提升,但其中相当比例的代码撑不过几周,就得被工程师推翻重写。数量上去了,质量在漏。

这一问题的核心,在于开发者和管理者所依赖的效率指标本身出了问题。眼下硅谷开发者圈子里, Token 预算,即开发者被授权消耗的 AI 算力额度,已经成为某种身份象征,预算越大,似乎越能彰显工程师地位。但这是一个荒诞的逻辑:衡量的是投入,而非产出。如果一家公司想的是推广 AI 采用率,或者本身就在卖 Token ,这套指标或许说得通。想提升效率的话,它什么都说明不了。

Waydev 的 CEO 兼创始人 Alex Circei 正在构建一套追踪这些动态的智能分析层。他的公司服务于 50 家客户,覆盖超过 1 万名软件工程师。据他观察,工程管理者们看到的代码接受率高达 80% 到 90%,即开发者批准并保留的 AI 生成代码比例。但这个数字掩盖了真正的问题:工程师在随后几周内不得不频繁返工修改,实际有效接受率跌至生成量的 10% 到 30%。

Waydev 成立于 2017 年,原本专注于开发者数据分析。过去六个月,面对快速扩张的 AI 编程工具生态,公司彻底重构了自己的平台,推出了专门追踪 AI 智能体行为元数据的新工具,向工程管理者提供代码质量与成本的分析视图。

来自行业不同角落的数据,指向高度一致的结论。 GitClear 今年 1 月发布的报告指出, AI 工具虽然提升了生产力,但“高频 AI 用户的代码搅动率( code churn )平均是非 AI 用户的 9.4 倍”远超工具本身带来的生产力增益。工程分析平台 Faros AI 在其 2026 年 3 月的报告中,基于两年客户数据得出结论:在高度采用 AI 的团队中,代码删除与新增的比例上升了 861%。

Jellyfish 在 2026 年第一季度收集了 7548 名工程师的数据,发现 Token 预算最高的工程师提交了最多的 Pull Request ,但生产力提升并不成比例: 10 倍的 Token 成本,换来的只是 2 倍的吞吐量。工具制造的是体量,不是价值。

与开发者交流,这些数字并不让人意外。代码审查积压、技术债攀升,是高频 AI 用户普遍提及的现象。有一个反复出现的差异:资深工程师和初级工程师对 AI 生成代码的处理方式截然不同,后者更倾向于直接接受,随之而来的是更大规模的后续重写。

大公司也在注意到这一问题。 Atlassian 去年斥资 10 亿美元收购了同类工程智能创业公司 DX ,目的是帮助客户厘清 AI 编程智能体的真实投资回报。

即便如此,开发者们并没有打算回头。 Alex Circei 的判断是:“这是软件开发的新时代,作为公司你必须适应,而且是被迫适应。它不会是一个过去就算了的周期。”


创艺洞察

这篇报道真正有意思的地方,不在于“AI 代码质量存疑”这个早已成为业界共识的结论本身,而在于它揭示了一个指标陷阱的形成机制。 Token 预算作为荣誉标志在开发者文化中的流行,本质上是把工具销售商的商业逻辑内化成了工程师的自我评估标准。这不是第一次发生:当年用代码行数衡量程序员产出时,业界也经历过同样的荒诞阶段。更值得关注的是初级工程师群体,他们在 AI 工具加持下产出了大量代码,却缺乏判断这些代码好坏的经验积累,而这部分隐性的能力退化,在任何现有指标里都找不到踪迹。

相关文章

三种记忆模式解决 AI 智能体的金鱼记忆
AI 新闻资讯
2026年5月12日
0 条评论
小创

三种记忆模式解决 AI 智能体的金鱼记忆

很多 AI 智能体表现“迟钝”,往往并非模型能力不足,而是缺乏记忆机制。Google 技术专家基于 ADK 提出三种解决方案:会话记忆让助手在单次对话中记住上下文;多智能体状态共享支持多个智能体通过键值对协作传递信息;持久化存储则利用数据库替代内存,使智能体能跨越重启记录用户偏好。这些方法能有效解决“金鱼记忆”问题,帮助开发者构建更连贯、具备长期服务能力的个人助理应用。

#智能体工程
阅读全文
Mistral 把编程 Agent 扔进云里
AI 编程开发
2026年5月12日
0 条评论
零重力瓦力

Mistral 把编程 Agent 扔进云里

Mistral 推出 Medium 3.5 开源模型与 Vibe 远程代理,将编程协作从“人机同步”转向“异步委派”。128B 稠密模型以 77.6% 的 SWE-Bench 成绩超越 Claude Sonnet 4,支持自部署。Vibe 允许开发者在云端沙箱并行运行多个任务,自动提交 PR 并通知审查。配合 Le Chat 通用工作模式,该方案适合追求效率的团队及关注数据安全的独立开发者,重新定义了 AI 辅助编码的工作流。

#Mistral#开源模型#AI 编程
阅读全文
ChatGPT 开始卖广告了,但 OpenAI 真正的野心在语音
AI 新闻资讯
2026年5月8日
0 条评论
小创

ChatGPT 开始卖广告了,但 OpenAI 真正的野心在语音

5 月 7 日,OpenAI 在英、巴等五国启动 ChatGPT 广告内测,并推出三款具备 GPT-5 级推理能力的实时语音模型。广告业务强调隐私与回答独立性,旨在探索免费用户变现路径。新语音模型则支持复杂任务操作,加速企业付费场景落地。此举标志 OpenAI 从技术验证转向商业模式规模化,证明 AI 产品可兼顾用户体验与多元盈利,为行业商业化提供了关键风向标。

#OpenAI
阅读全文
互动讨论

评论区

围绕《追求 Token 最大化:反而让开发者效率降低》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。