OpenAI Codex 借助 Computer Use 转型为超级应用

OpenAI 将 Codex 升级为全能桌面工作中心,实现从编程助手到工作操作系统的战略跨越。新版本支持多智能体并行控制 macOS 、内置浏览器评论、 GPT-image-1.5 图像生成等功能,整合 90 余个新插件,并确立 GPT-5.4 为推荐模型。目前周活开发者超 300 万,企业用量较年初增长 6 倍。 OpenAI 刻意回避“编程助手”定位,转而强调打造开发者日常操作界面,这标志着智能体正从单点工具向多模态交互、系统级产品演进。

发布于2026年4月17日 13:55
编辑小创
评论0
阅读37

OpenAI Codex 升级为全能桌面工作台:编程助手到生产操作系统的跨越

OpenAI 于本周三正式将 Codex 从云端编程智能体扩展为支持 macOS 计算机控制的桌面工作中心。新版本实现了多个行业首次,包括让多个智能体在后台并行操作桌面应用程序、拥有独立光标的可视化控制,以及通过 GPT-image-1.5 模型直接生成图像。这些能力意味着开发者可以在不离开 Codex 的情况下完成从编码、测试、浏览器调试到视觉资产生成的完整工作流。

核心功能全面升级

Codex 的此次迭代在多个维度实现了突破。在操作系统层面,新增的背景计算机使用功能允许智能体用自己的光标在 Mac 上观察界面、执行点击和文字输入,用户可以在同一时间继续处理其他任务。内置浏览器现在支持开发者直接在页面元素上添加评论,特别适合前端迭代、应用程序和游戏开发场景。图像生成功能整合了 GPT-image-1.5 模型,可以根据自然语言描述快速产出设计素材。

在生态扩展方面,超过 90 个新插件现已上架,支持的第三方工具链显著丰富。多终端标签页让并行处理多个命令行任务成为可能, SSH 访问通道可以直接连接远程开发环境。更丰富的文件预览功能改进了一站式查看代码、日志和产物的体验,新增的摘要面板则聚合了计划信息、数据来源和生成内容的统一视图。

技术架构层面, OpenAI 已经将 GPT-5.4 确立为 Codex 的推荐模型。这被公司描述为 Codex 中首个具备原生计算机使用能力的多用途模型,同时带来了实验性的 100 万 Token 上下文窗口支持。

定位转向:从编程助手到工作操作系统

这次更新的战略意义在于定位的根本转变。 2025 年首次亮相时, Codex 被定位为云端软件工程智能体,在沙盒环境中并行处理与代码仓库相关的任务。今年 2 月推出的 Codex 应用将其升级为桌面命令中心,整合了并行智能体、工作树、内置 Git 工具、自动化脚本和长时运行线程。此次迭代则将这个桌面工具进一步推向全能工作层。

OpenAI 在公告中披露了最新的用户规模数据。目前每周有超过 300 万开发者在使用 Codex ,另一份发布于 4 月的报告则独立确认了 200 万周活用户数。关键的增长指标来自企业市场:自今年 1 月以来, ChatGPT Business 和 Enterprise 产品中的 Codex 使用量增长了 6 倍。

商业化布局同步推进。 Codex 现已包含在所有 ChatGPT 订阅计划中,同时针对 Business 和 Enterprise 客户推出了独立的按量付费席位。这些调整表明 OpenAI 的意图并非让 Codex 停留在终端内的辅助工具角色,而是要将其打造为软件开发者日常的工作操作界面。

功能上线的节奏存在明显的分阶段特征。计算机控制功能目前仅面向 macOS 用户开放,而个性化和记忆功能、企业和教育版本的多语言支持仍在开发中。值得注意的是,尽管 Codex 应用本身已支持 Windows 平台,部分亮点功能却尚未同步上线,这种平台与区域的分层部署策略可能会对跨平台团队带来不同的采用体验。

竞争格局与行业信号

OpenAI 的这步棋指向了更宏观的行业趋势。模型层的能力释放正在驱动应用层的形态重构,智能体不再局限于单一任务的自动化,而是向着多模态交互、多工具协同、持续运行的系统级产品演进。 Codex 的演进轨迹恰好映射了这一路径:从代码生成工具到桌面控制中枢,再到横跨开发全流程的工作平台。能否在日常操作系统的体验层面建立用户粘性,将是这场转型能否成功的关键。


创艺洞察

这场发布藏着一个值得关注的细节: OpenAI 刻意回避了“编程助手”这一表述,转而强调“日常操作界面”。这不仅是措辞的调整,更是对智能体发展路径的一次宣言。当模型具备了看、点、运行的能力,如何让这些能力无缝嵌入用户真实的工作节奏,而非停留在单点功能的惊艳,将成为下一阶段竞争的分水岭。 Codex 的野心不难读懂:成为开发者打开电脑后第一个启动、最后才关闭的应用。但如果这个目标成立,跨平台一致性、用户隐私边界、以及多智能体并行场景下的资源调度,都将是被持续追问的核心命题。

相关文章

如果你还没用过 OpenClaw,2026.5.2 版是一个好起点
AI 产品工具
2026年5月12日
0 条评论
零重力瓦力

如果你还没用过 OpenClaw,2026.5.2 版是一个好起点

OpenClaw 2026.5.2 稳定版发布,核心策略转向“做减法”。xAI Grok 4.3 成为默认模型,赋予智能体实时信息获取能力。架构上,插件与诊断模块外移,实现按需安装,显著降低体积并提升维护效率。Gateway 热路径性能优化修复了 268 个 Bug,大幅改善启动速度与运行稳定性。新增 SDK tools.invoke RPC 接口,打通外部系统调用通道,标志着框架从个人助手向基础设施演进。

#OpenClaw#Grok
阅读全文
文字转 CAD AI 完整指南
AI 产品工具
2026年5月9日
0 条评论
小创

文字转 CAD AI 完整指南

文本转 CAD AI 正重塑工程设计方式:用户通过自然语言描述即可在 60 秒内生成可编辑的三维模型。主流工具如 Zoo 、 AdamCAD 等已实现商业化应用, 2026 年进入生产可用阶段。文章强调输入质量决定输出质量,提供了从设计描述到模型生成的完整工作流,并指出 CAD 工具的价值门槛正从“会操作”转向“会描述”,提示词能力成为工程师的核心竞争力。

#3D 生成
阅读全文
ChatGPT 开始卖广告了,但 OpenAI 真正的野心在语音
AI 新闻资讯
2026年5月8日
0 条评论
小创

ChatGPT 开始卖广告了,但 OpenAI 真正的野心在语音

5 月 7 日,OpenAI 在英、巴等五国启动 ChatGPT 广告内测,并推出三款具备 GPT-5 级推理能力的实时语音模型。广告业务强调隐私与回答独立性,旨在探索免费用户变现路径。新语音模型则支持复杂任务操作,加速企业付费场景落地。此举标志 OpenAI 从技术验证转向商业模式规模化,证明 AI 产品可兼顾用户体验与多元盈利,为行业商业化提供了关键风向标。

#OpenAI
阅读全文
互动讨论

评论区

围绕《OpenAI Codex 借助 Computer Use 转型为超级应用》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。