OpenAI 推出软件工程智能体:Codex

OpenAI 在 ChatGPT 中上线 Codex 研究预览版——一款基于云端、由全新 Codex-1 模型驱动的软件工程智能体。它可深度集成 GitHub 仓库,自动解析代码、发现并修复错误、提出优化建议,并完成从问题分析到测试验证的完整开发流程,支持多任务并行与沙盒化执行,现面向 Pro、企业及团队用户开放。

发布于2025年5月17日 04:37
编辑零重力瓦力
评论0
阅读31

OpenAI 今天再 ChatGPT 中推出了 Codex 研究预览版。新的 Codex 作为软件工程智能体意味着,AI 辅助编程从 "自动补全" 逐渐成为 "智能协作"。

Codex 的技术突破

Codex 是一个远程智能体软件系统,可以并行运行多种任务。与之前发布的本地运行的 Codex CLI 不同,新版 Codex 建立在 OpenAI 的云端计算资源之上,让用户能够启动多个智能体实例同时处理不同任务。系统由全新的 Codex-1 模型驱动,这是 OpenAI 迄今为止性能最优的编程模型,基于 o3 架构进行了专门优化。

该模型不仅关注基准测试成绩,更注重实际代码库整合的实用性,考虑了注释、变更合理性、代码风格等多方面因素。Codex 的一个显著特点是它可以与用户的 GitHub 代码仓库直接集成,读取并理解整个代码库,然后执行各种复杂任务。

工作原理与功能演示

在演示中,OpenAI 团队展示了 Codex 的几项核心能力:

  1. 代码解析与解释:Codex 能够阅读并向新手解释复杂代码库的结构和功能。
  2. 自动错误发现与修复:系统能够在代码库中检测并修复各类错误,包括类型错误、语法错误和逻辑缺陷。演示中,Codex 成功找出并修复了带有特殊字符的文件名导致的错误。
  3. 主动提出改进建议:Codex 不仅能够被动响应指令,还能主动分析代码库并提出优化建议,如修正可变对象作为默认参数、统一超时设置等。
  4. 完整工作流程:最令人印象深刻的是,Codex 能够完成从问题分析、代码编写到测试运行的完整流程。它会创建测试用例重现问题,编写解决方案,运行测试验证修复是否有效,最后提交完整的变更说明。

每个 Codex 任务都在独立的沙盒环境中运行,拥有自己的文件系统、CPU、内存和网络策略。系统使用的基础设施与 OpenAI 用于强化学习训练的系统相同,已经在大规模实战中经过验证。

实际应用体验

OpenAI 内部用户分享了使用 Codex 的经验,描述了如何将其融入日常工作流程。一个常见场景是,在处理其他任务时,用户可以花 30 秒向 Codex 提交代码变更请求,然后继续其他工作。稍后回来时,Codex 已经完成了任务,用户只需审核结果并决定是否采纳。

系统的透明性和可验证性是其关键优势。用户可以查看 Codex 做出的所有更改、参考的代码片段以及运行的测试结果,这使得代码审核变得直观高效。正如开发团队成员 Katy 所言:"Codex 和我们的同事一样值得信赖,甚至更值得,因为我能看到它的所有操作日志和测试输出。"

行业影响

OpenAI 认为,Codex 代表了软件工程未来的发展方向。随着开发人员更多地依赖 AI 协助,开发模式正在从"完全手动" 向 "人机协作" 转变。Codex 通过允许开发者告诉 AI "做什么 "而不是" 怎么做",释放了更多创造力。

未来,OpenAI 计划将 Codex 集成到更多系统中,如 Issue 追踪器、OpenAPI 规范和 CI/CD 流程。团队还设想了本地智能体与云端智能体的融合,一个既能查看本地代码又有独立计算能力的 "远程同事",可以无缝接管用户的工作。

Codex 现已向 ChatGPT Pro、企业和团队用户开放,后续将支持 Plus 和 Edu 用户。OpenAI 初期提供了慷慨的使用限额,不收取额外费用,但随着使用方式逐渐明确,可能会调整限额并考虑额外付费模式。

相关文章

Claude 自己开机器狗:比人快20 倍,代码量只有十分之一
访谈案例
2026年6月21日
0 条评论
零重力瓦力

Claude 自己开机器狗:比人快20 倍,代码量只有十分之一

Anthropic 实验显示,Claude Opus 4.7 已能全程自主控制机器狗完成任务,速度比人类快约 20 倍,代码量仅为其十分之一。这标志着 AI 智能体正从辅助编程迈向物理工具自主操作阶段。但模型在实时闭环精细控制上仍有局限,且当前成果基于低复杂度任务。该进展体现了通用模型 scaling 的副产物效应,预示物理智能体时代早期来临,但距离解决复杂真实场景仍有差距。

#Claude#AI 编程
阅读全文
微软 Mirage:让世界模型学会“过目不忘”,速度快 10 倍、显存省 55 倍
AI 产品工具
2026年6月21日
0 条评论
零重力瓦力

微软 Mirage:让世界模型学会“过目不忘”,速度快 10 倍、显存省 55 倍

微软研究院联合多所高校发布 Mirage 模型,通过在扩散模型隐空间直接存储三维记忆,解决了 AI 视频生成中场景一致性差及计算昂贵的问题。该方案摒弃传统 RGB 点云渲染流程,使生成速度提升最高 10.57 倍,显存占用降低 55 倍,且长视频边际成本几乎不增。测试显示其三维与光度一致性优于现有方案,虽暂不支持动态物体记忆,但已开源并适用于机器人仿真等静态场景任务。

#世界模型
阅读全文
JetBrains Junie 正式版:AI 编程 Agent 学会了用调试器断点
AI 编程开发
2026年6月19日
0 条评论
零重力瓦力

JetBrains Junie 正式版:AI 编程 Agent 学会了用调试器断点

JetBrains AI 编程 Agent Junie 正式 GA,在 SWE-Rebench 基准测试中排名第一。其核心优势在于深度集成 IDE 原生工具链,而非模拟替代。主要特性包括:Plan 模式生成结构化计划文档以防跑偏;原生调试器集成支持断点与运行时状态检查;支持异步远程控制长任务;基于项目上下文的交互式代码审查;以及模型自由切换以优化成本。Junie 标志着 AI 编程竞争正从模型能力转向工具集成深度。

#智能体#AI 编程
阅读全文
互动讨论

评论区

围绕《OpenAI 推出软件工程智能体:Codex》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。