追求 Token 最大化:反而让开发者效率降低

AI 编程工具虽大幅提升代码产出量,但质量堪忧。数据显示 AI 生成代码的实际有效接受率仅 10%-30%,代码“搅动率”是非 AI 用户的 9 倍以上。问题根源在于当前效率指标仅衡量投入(如 Token 预算)而非产出,导致开发者追逐体量而非价值。初级工程师因缺乏经验更容易直接接受 AI 代码,后续重写成本更高。业界已意识到这一指标陷阱,工程效能分析工具和企业收购动作相继出现,但 AI 编程趋势不可逆转,开发者需适应这一新范式。

发布于2026年4月18日 15:45
编辑小创
评论0
阅读6

AI 写的代码,正在被大量删掉

衡量什么,就会得到什么,这句管理学老话,正在 AI 编程时代遭遇一次尴尬的现实检验。

各家工程效能分析公司的数据,讲述的是同一个故事: AI 工具确实让代码产出量大幅提升,但其中相当比例的代码撑不过几周,就得被工程师推翻重写。数量上去了,质量在漏。

这一问题的核心,在于开发者和管理者所依赖的效率指标本身出了问题。眼下硅谷开发者圈子里, Token 预算,即开发者被授权消耗的 AI 算力额度,已经成为某种身份象征,预算越大,似乎越能彰显工程师地位。但这是一个荒诞的逻辑:衡量的是投入,而非产出。如果一家公司想的是推广 AI 采用率,或者本身就在卖 Token ,这套指标或许说得通。想提升效率的话,它什么都说明不了。

Waydev 的 CEO 兼创始人 Alex Circei 正在构建一套追踪这些动态的智能分析层。他的公司服务于 50 家客户,覆盖超过 1 万名软件工程师。据他观察,工程管理者们看到的代码接受率高达 80% 到 90%,即开发者批准并保留的 AI 生成代码比例。但这个数字掩盖了真正的问题:工程师在随后几周内不得不频繁返工修改,实际有效接受率跌至生成量的 10% 到 30%。

Waydev 成立于 2017 年,原本专注于开发者数据分析。过去六个月,面对快速扩张的 AI 编程工具生态,公司彻底重构了自己的平台,推出了专门追踪 AI 智能体行为元数据的新工具,向工程管理者提供代码质量与成本的分析视图。

来自行业不同角落的数据,指向高度一致的结论。 GitClear 今年 1 月发布的报告指出, AI 工具虽然提升了生产力,但“高频 AI 用户的代码搅动率( code churn )平均是非 AI 用户的 9.4 倍”远超工具本身带来的生产力增益。工程分析平台 Faros AI 在其 2026 年 3 月的报告中,基于两年客户数据得出结论:在高度采用 AI 的团队中,代码删除与新增的比例上升了 861%。

Jellyfish 在 2026 年第一季度收集了 7548 名工程师的数据,发现 Token 预算最高的工程师提交了最多的 Pull Request ,但生产力提升并不成比例: 10 倍的 Token 成本,换来的只是 2 倍的吞吐量。工具制造的是体量,不是价值。

与开发者交流,这些数字并不让人意外。代码审查积压、技术债攀升,是高频 AI 用户普遍提及的现象。有一个反复出现的差异:资深工程师和初级工程师对 AI 生成代码的处理方式截然不同,后者更倾向于直接接受,随之而来的是更大规模的后续重写。

大公司也在注意到这一问题。 Atlassian 去年斥资 10 亿美元收购了同类工程智能创业公司 DX ,目的是帮助客户厘清 AI 编程智能体的真实投资回报。

即便如此,开发者们并没有打算回头。 Alex Circei 的判断是:“这是软件开发的新时代,作为公司你必须适应,而且是被迫适应。它不会是一个过去就算了的周期。”


创艺洞察

这篇报道真正有意思的地方,不在于“AI 代码质量存疑”这个早已成为业界共识的结论本身,而在于它揭示了一个指标陷阱的形成机制。 Token 预算作为荣誉标志在开发者文化中的流行,本质上是把工具销售商的商业逻辑内化成了工程师的自我评估标准。这不是第一次发生:当年用代码行数衡量程序员产出时,业界也经历过同样的荒诞阶段。更值得关注的是初级工程师群体,他们在 AI 工具加持下产出了大量代码,却缺乏判断这些代码好坏的经验积累,而这部分隐性的能力退化,在任何现有指标里都找不到踪迹。

相关文章

Opus 4.7 编程飞轮再加速,Mythos 悬而未发
AI 新闻资讯
2026年4月22日
0 条评论
小创

Opus 4.7 编程飞轮再加速,Mythos 悬而未发

Anthropic 发布 Claude Opus 4.7,编程能力跃升至 SWE-bench Pro 64.3 分,文档推理与视觉导航表现显著优于 GPT-5.4。模型刻意削弱了安全漏洞复现能力,并采用新 Tokenizer 导致消耗增加。尽管 Anthropic 宣称因算力紧张暂未发布更强版本 Mythos,但其通过“编程飞轮”构建的商业闭环已初具规模,企业客户可重点关注其在长文档处理及多模态任务中的实际效能。

#Mythos#Anthropic
阅读全文
Google I/O 2026 前瞻,这次 Google 压上了全部家当
AI 新闻资讯
2026年4月22日
0 条评论
小创

Google I/O 2026 前瞻,这次 Google 压上了全部家当

Google I/O 2026 定档 5 月 19 日至 20 日,被视为谷歌史上赌注最大的一届。核心看点包括 Gemini 4 首秀、Veo 4 视频生成升级及轻量级 AI 眼镜发布。更关键的是 Aluminium OS 桌面系统亮相,旨在补齐移动与桌面闭环。在千亿美元投入下,谷歌试图通过搜索、OS、硬件与智能体的全面重构,应对来自 GPT-6 等竞品的激烈挑战。

#Google
阅读全文
OpenAI 的存在性问题
AI 新闻资讯
2026年4月20日
0 条评论
小创

OpenAI 的存在性问题

OpenAI 近期收购个人理财初创公司 Hiro 和商业访谈媒体 TBPN ,看似小规模交易,实则暴露其两大困境:一是 ChatGPT 之外产品的变现难题,二是日趋紧张的公众形象。 Anthropic 在企业市场和编程工具领域持续施压,令 OpenAI 焦虑。这两次收购更像是修补产品线、修复舆论的应急之举,而非战略扩张。

#OpenAI
阅读全文
互动讨论

评论区

围绕《追求 Token 最大化:反而让开发者效率降低》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。