OpenAI 推出其最新一代大语言模型 o1-preview 及其精简版 o1-mini。这两款模型在推理能力和思考过程方面取得了重大突破,开创了 AI 发展的新范式。

OpenAI o1项目组负责人 Bob McGrew 介绍,o1 系列模型在回答问题前会进行更深入的思考,能够像人类一样进行多步推理。与以往模型相比,用户在使用 o1 时会感受到明显的不同。

o1 的开发历程可以追溯到 OpenAI 早期受 AlphaGo 启发的研究。团队多年来一直在探索如何将监督学习与强化学习相结,最终在 o1 项目中实现了突破。开发团队成员回忆,在某个关键时刻,他们投入了比以往更多的计算资源,首次生成了具有连贯思维链的模型,这标志着项目取得了实质性进展。

o1 在多个领域展现出卓越能力。在数学问题求解方面,开发人员观察到 o1 能够像人类数学家一样,在时间限制内权衡不同的解题策略。在代码编写任务中,o1 不仅能生成代码,还能进行自我质疑和反思,这种能力让开发者感到惊喜。

有趣的是,开发团队还提到了给 o1 赋予"个性"的过程。起初,模型对于"爱"等抽象概念的回答较为机械,但经过调整后,o1 能够从多个角度诠释爱的含义,甚至尝试用代数来定义爱,展现出更强烈的个性色彩。

o1-mini 是 o1 的精简版本,保留了核心的推理框架,但计算成本和延迟更低。开发团队将其描述为 o1 完整流程和框架的"最小化演示",虽然可能对外部信息的了解有所欠缺,但在推理能力上几乎不逊色于 o1-preview。OpenAI 希望借此将先进的 AI 能力带给更广泛的受众。

开发团队强调,o1 项目的成功得益于团队的密切合作和持续创新。他们提到,项目中遇到了许多技术挑战,如大规模模型训练中的各种问题,但团队成员之间的紧密合作帮助他们克服了这些障碍。一位团队成员甚至提到了 "Wenda 祝福其他人" 的趣事,作为 o1 开发团队成员 Wenda Zhou 似乎拥帮助同事快速解决棘手问题的能力。

OpenAI  o1 是如何诞生的

OpenAI 的研究人员表示,赋予 AI 更强的推理能力是实现通用人工智能的关键一步。他们认为, o1 代表了向着能够进行长时间思考和研究的 AI 迈出的第一步。有研究人员表示,他们的终极目标是开发出能够持续思考几个月甚至几年的 AI 模型。

o1 的推出标志着 AI 技术进入了一个新阶段。开发团队成员表示,他们被 o1 展现出的能力所震撼,有些人形容与 o1 互动是一种"精神体验"。随着这类具有深度推理能力的 AI 模型不断发展,它们有望在科学研究、问题解决和辅助人类决策等方面发挥越来越重要的作用。