OpenAI 推出软件工程智能体：Codex

OpenAI 今天再 ChatGPT 中推出了 Codex 研究预览版。新的 Codex 作为软件工程智能体意味着，AI 辅助编程从 "自动补全" 逐渐成为 "智能协作"。

Codex 的技术突破

Codex 是一个远程智能体软件系统，可以并行运行多种任务。与之前发布的本地运行的 Codex CLI 不同，新版 Codex 建立在 OpenAI 的云端计算资源之上，让用户能够启动多个智能体实例同时处理不同任务。系统由全新的 Codex-1 模型驱动，这是 OpenAI 迄今为止性能最优的编程模型，基于 o3 架构进行了专门优化。

该模型不仅关注基准测试成绩，更注重实际代码库整合的实用性，考虑了注释、变更合理性、代码风格等多方面因素。Codex 的一个显著特点是它可以与用户的 GitHub 代码仓库直接集成，读取并理解整个代码库，然后执行各种复杂任务。

工作原理与功能演示

在演示中，OpenAI 团队展示了 Codex 的几项核心能力：

代码解析与解释：Codex 能够阅读并向新手解释复杂代码库的结构和功能。
自动错误发现与修复：系统能够在代码库中检测并修复各类错误，包括类型错误、语法错误和逻辑缺陷。演示中，Codex 成功找出并修复了带有特殊字符的文件名导致的错误。
主动提出改进建议：Codex 不仅能够被动响应指令，还能主动分析代码库并提出优化建议，如修正可变对象作为默认参数、统一超时设置等。
完整工作流程：最令人印象深刻的是，Codex 能够完成从问题分析、代码编写到测试运行的完整流程。它会创建测试用例重现问题，编写解决方案，运行测试验证修复是否有效，最后提交完整的变更说明。

每个 Codex 任务都在独立的沙盒环境中运行，拥有自己的文件系统、CPU、内存和网络策略。系统使用的基础设施与 OpenAI 用于强化学习训练的系统相同，已经在大规模实战中经过验证。

实际应用体验

OpenAI 内部用户分享了使用 Codex 的经验，描述了如何将其融入日常工作流程。一个常见场景是，在处理其他任务时，用户可以花 30 秒向 Codex 提交代码变更请求，然后继续其他工作。稍后回来时，Codex 已经完成了任务，用户只需审核结果并决定是否采纳。

系统的透明性和可验证性是其关键优势。用户可以查看 Codex 做出的所有更改、参考的代码片段以及运行的测试结果，这使得代码审核变得直观高效。正如开发团队成员 Katy 所言："Codex 和我们的同事一样值得信赖，甚至更值得，因为我能看到它的所有操作日志和测试输出。"

行业影响

OpenAI 认为，Codex 代表了软件工程未来的发展方向。随着开发人员更多地依赖 AI 协助，开发模式正在从"完全手动" 向 "人机协作" 转变。Codex 通过允许开发者告诉 AI "做什么 "而不是" 怎么做"，释放了更多创造力。

未来，OpenAI 计划将 Codex 集成到更多系统中，如 Issue 追踪器、OpenAPI 规范和 CI/CD 流程。团队还设想了本地智能体与云端智能体的融合，一个既能查看本地代码又有独立计算能力的 "远程同事"，可以无缝接管用户的工作。

Codex 现已向 ChatGPT Pro、企业和团队用户开放，后续将支持 Plus 和 Edu 用户。OpenAI 初期提供了慷慨的使用限额，不收取额外费用，但随着使用方式逐渐明确，可能会调整限额并考虑额外付费模式。

Codex 的技术突破

工作原理与功能演示

实际应用体验

行业影响

相关文章

GPT-5.6 Sol Ultra 1 小时证明 60 年未解的图论猜想

Google 为何要开发 Gemma 4 模型

一个人用 Claude 把 53 万行 Zig 重写成 Rust

评论区