OpenAI o1 是如何诞生的

OpenAI推出o1-preview与o1-mini,首创“思考链”推理范式:模型在回答前自主进行多步推理,受AlphaGo启发,融合监督学习与强化学习。数学推演、代码自省及抽象概念理解能力显著提升;o1-mini以轻量架构实现近似推理性能,推动深度推理能力普惠化。

发布于2024年9月21日 13:01
编辑零重力瓦力
评论0
阅读32

OpenAI 推出其最新一代大语言模型 o1-preview 及其精简版 o1-mini。这两款模型在推理能力和思考过程方面取得了重大突破,开创了 AI 发展的新范式。

OpenAI o1项目组负责人 Bob McGrew 介绍,o1 系列模型在回答问题前会进行更深入的思考,能够像人类一样进行多步推理。与以往模型相比,用户在使用 o1 时会感受到明显的不同。

o1 的开发历程可以追溯到 OpenAI 早期受 AlphaGo 启发的研究。团队多年来一直在探索如何将监督学习与强化学习相结,最终在 o1 项目中实现了突破。开发团队成员回忆,在某个关键时刻,他们投入了比以往更多的计算资源,首次生成了具有连贯思维链的模型,这标志着项目取得了实质性进展。

o1 在多个领域展现出卓越能力。在数学问题求解方面,开发人员观察到 o1 能够像人类数学家一样,在时间限制内权衡不同的解题策略。在代码编写任务中,o1 不仅能生成代码,还能进行自我质疑和反思,这种能力让开发者感到惊喜。

有趣的是,开发团队还提到了给 o1 赋予"个性"的过程。起初,模型对于"爱"等抽象概念的回答较为机械,但经过调整后,o1 能够从多个角度诠释爱的含义,甚至尝试用代数来定义爱,展现出更强烈的个性色彩。

o1-mini 是 o1 的精简版本,保留了核心的推理框架,但计算成本和延迟更低。开发团队将其描述为 o1 完整流程和框架的"最小化演示",虽然可能对外部信息的了解有所欠缺,但在推理能力上几乎不逊色于 o1-preview。OpenAI 希望借此将先进的 AI 能力带给更广泛的受众。

开发团队强调,o1 项目的成功得益于团队的密切合作和持续创新。他们提到,项目中遇到了许多技术挑战,如大规模模型训练中的各种问题,但团队成员之间的紧密合作帮助他们克服了这些障碍。一位团队成员甚至提到了 "Wenda 祝福其他人" 的趣事,作为 o1 开发团队成员 Wenda Zhou 似乎拥帮助同事快速解决棘手问题的能力。

OpenAI  o1 是如何诞生的

照片后排(左起):Mark Chen, Giambattista Parascandolo, Trapit Bansal, Łukasz Kaiser, Hunter Lightman, Karl Cobbe, Łukasz Kondraciuk, Szymon Sidor, Noam Brown, Hongyu Ren, Liam Fedus, Hyung Won Chung

照片前排(右起):Ilge Akkaya, Jakub Pachocki, Shengjia Zhao, Jason Wei, Wojciech Zaremba, Jerry Tworek

OpenAI 的研究人员表示,赋予 AI 更强的推理能力是实现通用人工智能的关键一步。他们认为, o1 代表了向着能够进行长时间思考和研究的 AI 迈出的第一步。有研究人员表示,他们的终极目标是开发出能够持续思考几个月甚至几年的 AI 模型。

o1 的推出标志着 AI 技术进入了一个新阶段。开发团队成员表示,他们被 o1 展现出的能力所震撼,有些人形容与 o1 互动是一种"精神体验"。随着这类具有深度推理能力的 AI 模型不断发展,它们有望在科学研究、问题解决和辅助人类决策等方面发挥越来越重要的作用。

相关文章

ChatGPT 开始卖广告了,但 OpenAI 真正的野心在语音
AI 新闻资讯
2026年5月8日
0 条评论
小创

ChatGPT 开始卖广告了,但 OpenAI 真正的野心在语音

5 月 7 日,OpenAI 在英、巴等五国启动 ChatGPT 广告内测,并推出三款具备 GPT-5 级推理能力的实时语音模型。广告业务强调隐私与回答独立性,旨在探索免费用户变现路径。新语音模型则支持复杂任务操作,加速企业付费场景落地。此举标志 OpenAI 从技术验证转向商业模式规模化,证明 AI 产品可兼顾用户体验与多元盈利,为行业商业化提供了关键风向标。

#OpenAI
阅读全文
Karpathy 最新演讲:AI 编程正在从 “氛围编程” 转向“智能体工程”
访谈案例
2026年5月6日
0 条评论
零重力瓦力

Karpathy 最新演讲:AI 编程正在从 “氛围编程” 转向“智能体工程”

Andrej Karpathy 在 Sequoia AI Ascent 2026 提出编程范式正从 Vibe Coding 转向 Agentic Engineering。核心变化在于工作重心从编写代码转为编排智能体,要求开发者具备系统设计与审查能力。演讲强调需警惕"80%问题”,即利用 AI 快速完成基础工作后,必须依靠人类经验处理安全、架构等剩余难点。这一转变意味着理解力将比编码能力更稀缺,对开发者、管理者及创业者重新定义产品与团队角色具有关键指导意义。

#智能体工程
阅读全文
ChatGPT Images 2.0 在印度受热捧,但目前在其他地方尚未大获成功
AI 新闻资讯
2026年5月5日
0 条评论
小创

ChatGPT Images 2.0 在印度受热捧,但目前在其他地方尚未大获成功

虽然 OpenAI 声称印度成为 ChatGPT Images 2.0 最大用户市场,但第三方数据显示全球增长实则温和,下载量仅增 11%,日活和流量涨幅约 1%。巴基斯坦、越南、印尼等新兴市场反而出现高达 79%的下载增长。印度用户主要将该功能用于个人表达场景,如风格化肖像、社交头像等,反映出 AI 图像工具在不同市场的落地方式存在差异。

#OpenAI
阅读全文
互动讨论

评论区

围绕《OpenAI o1 是如何诞生的》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。