Codex :万物之法典

OpenAI 发布 Codex 重大升级, AI 编程助手新增操控计算机、并行运行、记忆学习等能力,整合 90 余个插件。系统用户已超 300 万,正从辅助工具向“数字同事”角色转变,重新定义开发边界——人类负责决策创意,机器承担执行跟进。

发布于2026年4月17日 13:57
编辑小创
评论0
阅读26

OpenAI 发布 Codex 重大更新:智能体可操控计算机、覆盖软件开发全流程

2026 年 4 月 16 日, OpenAI 正式发布 Codex 重大版本升级。这套系统如今已成为超过 300 万开发者的日常工作伙伴,这些开发者每周都在借助 Codex 加速软件开发的各个环节。

新版 Codex 实现了多项关键突破。系统现在能够代替用户操控计算机,通过屏幕识别、鼠标点击和键盘输入完成各类操作。多个智能体可以在同一台 Mac 上并行运行,彼此之间互不干扰。此外, Codex 还集成了图像生成能力,可以记住用户偏好并从过往操作中持续学习,甚至能够承担周期性的重复工作任务。

在开发者工作流方面, Codex 带来了显著提升。系统现在支持处理 GitHub 代码评审评论、运行多个终端标签页、通过 SSH 连接远程开发环境。在应用内置浏览器中,用户可以直接在页面上添加评论,为智能体提供精确的操作指令。开发者还可以直接在侧边栏打开文件并预览 PDF 、电子表格、幻灯片和文档。

OpenAI 同时发布了超过 90 个新增插件,这些插件整合了各类技能、应用集成和 MCP 服务器,为 Codex 提供了更丰富的上下文获取和行动途径。其中对开发者最具实用价值的包括 Atlassian Rovo (用于管理 JIRA 、 CircleCI 、 CodeRabbit 、 GitLab Issues )、 Microsoft 办公套件、 Neon by Databricks 、 Remotion 、 Render 和 Superpowers 等。

新版 Codex 还强化了自动化能力。用户现在可以复用既有对话线程,保持之前建立的上下文不被中断。系统能够为自己安排未来任务并在指定时间自动唤醒,持续推进可能跨越数天甚至数周的长期工作。团队用户借助自动化功能处理各种事务,从处理待合并的 Pull Request 到跟进任务进度,再到监控 Slack 、 Gmail 和 Notion 等工具中的动态对话。

记忆功能也进入预览阶段。该功能允许 Codex 记住从过往经验中积累的有用上下文,包括个人偏好、纠正信息和需要时间收集的资料。这项能力让后续任务的完成速度大幅提升,质量也更接近过去只有通过大量定制指令才能达到的水平。

Codex 现在还能主动向用户推荐值得继续的工作。基于项目上下文、已连接插件和记忆数据,系统可以建议如何开始一天的工作或从何处继续之前的项目。例如, Codex 能够识别 Google 文档中待处理的相关评论,从 Slack 、 Notion 和代码库中提取背景信息,然后为用户提供一份优先级排列的行动清单。

这些更新即日起向已登录 ChatGPT 的 Codex 桌面应用用户推送。个性化功能(包括上下文感知建议和记忆)将陆续向 Enterprise 、 Edu 以及欧盟和英国用户开放。计算机后台操控功能目前仅支持 macOS ,欧盟和英国用户的访问权限也将很快解锁。

回顾 Codex 发布至今这一年来的发展轨迹,开发者对这套工具的使用方式已发生显著变化。用户最初接触 Codex 是为了编写代码,随后逐渐将其扩展到理解系统架构、收集背景资料、评审工作成果、调试问题、协调团队合作以及维持长期工作的推进等更广泛的场景。

OpenAI 的使命是确保通用人工智能惠及全人类,这其中自然包括缩小人们想象力与实际构建能力之间的差距。此次发布的更新让 Codex 更加深入地融入软件构建所涉及的工具、工作流和决策环节,更多能力已在规划之中。

创艺洞察

Codex 此次升级的意义远不止功能堆叠。当一个 AI 编程助手能够直接操控计算机、记住用户习惯、主动建议工作优先级时,它正在从“辅助工具”向“数字同事”的角色过渡。这种转变将重新定义开发者的工作边界,人类负责决策与创意,机器承担执行与跟进。值得关注的是,这种深度融入也意味着用户对系统的依赖会加速形成,未来如何保持人类在关键环节的主导权,将成为技术团队和终端用户都需要提前思考的命题。

相关文章

一段代码让网站出海,这个 AI 翻译工具把多语言 SEO 玩明白了
AI 产品工具
2026年6月1日
0 条评论
小创

一段代码让网站出海,这个 AI 翻译工具把多语言 SEO 玩明白了

跨境电商网站常因语言壁垒导致高跳出率。Weglot 是一款 AI 翻译工具,仅需几分钟即可通过添加脚本实现网站多语言本地化,且保持原有排版。该工具支持可视化编辑、术语表锁定及团队协作,便于后续维护。同时,它能自动优化 hreflang 标签、独立 URL 及元数据,解决多语言 SEO 难题。借助母语内容布局小语种市场,企业可以低成本获取流量红利,有效提升海外转化率。

阅读全文
SCOPE 给 AI 绘画装上了 “语义追踪器”,复杂提示词终于不用反复抽卡了
AI 产品工具
2026年6月1日
0 条评论
零重力瓦力

SCOPE 给 AI 绘画装上了 “语义追踪器”,复杂提示词终于不用反复抽卡了

中科大团队发布 SCOPE 框架,通过结构化语义规格解决 AI 绘画中复杂提示词语义丢失问题。该系统将提示词拆解为实体、约束及未知项,构建包含分解、合成、生成、验证的四步循环,并辅以检索、推理和修复技能,实现生成过程全程可追溯与精准修复。团队还推出 Gen-Arena 评测基准及 EGIP 指标。实验显示 SCOPE 在多项基准中表现优异,为多元素控制场景提供了工程化解决方案,代码已开源。

#AI 绘画
阅读全文
Stable Audio 3.0 发布:开源音频生成从 11 秒走到 6 分钟
AI 产品工具
2026年5月28日
0 条评论
零重力瓦力

Stable Audio 3.0 发布:开源音频生成从 11 秒走到 6 分钟

Stability AI 发布开源音频模型 Stable Audio 3.0,最长可生成 6 分 20 秒立体声音频。该模型采用 SAME 架构实现 4096 倍压缩,支持变量长度生成与局部编辑,Small 版本可在移动端离线运行。训练数据均获授权,规避版权风险。提供四个变体及 LoRA 微调文档,社区许可允许商用。此次升级标志着开源音频生成从短音效迈向完整歌曲创作,为开发者提供了本地化、合规的高质量音频生成方案。

#开源模型#AI 音乐
阅读全文
互动讨论

评论区

围绕《Codex :万物之法典》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。