OpenAI 发布最新推理模型 o3-mini:性能提升,首次向免费用户开放

OpenAI发布轻量推理模型o3-mini,首次向免费用户开放。支持函数调用、结构化输出与三档推理强度调节,在STEM任务中错误率降低39%,响应速度比o1-mini快24%。已上线ChatGPT及API,兼顾精度、速度与安全性。

发布于2025年2月1日 06:17
编辑零重力瓦力
评论0
阅读33

OpenAI 发布最新推理模型 o3-mini:性能提升,首次向免费用户开放

OpenAI 今日正式发布了其最新的小型推理模型 OpenAI o3-mini。这款模型是 OpenAI 推理系列中最具成本效益的版本,现已在 ChatGPT 和 API 平台上开放使用。早在 2024 年 12 月的预览中,o3-mini 便展示了其强大的科学、数学及编程能力。作为一款高效、快速的小型模型,o3-mini 在保持低成本和低延迟的同时,进一步推动了小型 AI 模型的能力边界。

功能升级:支持开发者需求的多样化特性

OpenAI o3-mini 是首款支持多项备受开发者期待功能的小型推理模型,包括“函数调用”、“结构化输出”和“开发者消息”。这些功能使 o3-mini 一经推出便具备直接用于生产环境的能力。此外,o3-mini 延续了 o1-mini 和o1-preview 的特性,支持流式输出。

开发者还可以根据具体需求,在低、中、高三个推理强度选项中灵活切换。这种调整机制能够让 o3-mini 在应对复杂问题时 “深度思考”,或者在低延迟要求下优先优化响应速度。不过,o3-mini 尚不支持视觉能力,因此视觉推理任务仍需使用 OpenAI o1。

自发布起,o3-mini 已通过 Chat Completions API、Assistants API 和 Batch API 向 API 使用等级为 3-5 的开发者逐步开放。

面向广泛用户的多样化访问方式

ChatGPT 的 Plus、Team 和 Pro 用户现已可以使用 o3-mini,企业用户的访问权限预计将在2月开放。与此同时,o3-mini 将取代 o1-mini 成为模型选择器中的默认选项,其提升的速率限制和更低的延迟使其成为编程、STEM 领域以及逻辑问题解决的理想选择。

为了回馈用户,Plus 和 Team 用户的每日使用限制将从 o1-mini 的 50 条提升至 o3-mini 的 150 条。此外,o3-mini 新增了搜索功能,可以实时查找最新答案并附带相关网页链接。目前,这项搜索功能仍处于原型阶段,未来将在更多推理模型中实现整合。

免费用户也可以通过在消息编辑器中选择 “Reason” 或重新生成响应来首次体验推理模型。这是 OpenAI 首次向免费用户开放推理模型。(这里需要开源推理模型 DeepSeek 给予 OpenAI 带来的压力)

技术领域的高效助手:速度与精确度的平衡

尽管 OpenAI o1 仍是通用知识推理的主力模型,但 o3-mini 为需要更高精度与速度的技术领域提供了一种优化方案。在 ChatGPT 中,o3-mini 默认使用中等推理强度,以平衡速度与准确性。付费用户还可以选择 o3-mini-high 这一更高智能版本,虽然响应时间稍长,但推理能力更强。Pro 用户还享有 o3-mini 和 o3-mini-high 的无限制访问权限。

o3-mini 在 STEM 推理方面的表现尤为突出。与 o1 相比,o3-mini 在中等推理强度下实现了对数学、科学和编程任务的快速响应,同时保持了与 o1 相当的性能。在专家评测中,o3-mini 在复杂的现实问题上表现出更强的推理能力,其回答的准确性和清晰度均优于 o1-mini。测试者更倾向于选择 o3-mini 的回答,并观察到其在困难问题上的重大错误率减少了39%。

性能提升:数学与编程领域的显著进步

OpenAI 发布最新推理模型 o3-mini:性能提升,首次向免费用户开放

OpenAI 发布最新推理模型 o3-mini:性能提升,首次向免费用户开放

OpenAI 发布最新推理模型 o3-mini:性能提升,首次向免费用户开放

OpenAI 发布最新推理模型 o3-mini:性能提升,首次向免费用户开放

OpenAI 发布最新推理模型 o3-mini:性能提升,首次向免费用户开放

OpenAI 发布最新推理模型 o3-mini:性能提升,首次向免费用户开放

OpenAI 发布最新推理模型 o3-mini:性能提升,首次向免费用户开放

OpenAI 发布最新推理模型 o3-mini:性能提升,首次向免费用户开放

OpenAI 发布最新推理模型 o3-mini:性能提升,首次向免费用户开放

用户偏好与响应速度

在用户偏好评测中,o3-mini 的 STEM 任务响应更为精准,非 STEM 任务的表现也优于 o1-mini。测试者在 56% 的情况下选择了o3-mini 的回答,并发现其在复杂问题上减少了 39% 的重大错误。

在响应速度上,o3-mini 的表现同样令人印象深刻。与 o1-mini 相比,o3-mini 的平均响应时间快了24%,达到 7.7 秒,而 o1-mini 的平均响应时间为 10.16 秒。此外,o3-mini 在生成首个响应 Token 的时间上比 o1-mini快了 2500 毫秒。

OpenAI 发布最新推理模型 o3-mini:性能提升,首次向免费用户开放

安全性与可靠性

OpenAI 在 o3-mini 的开发中采用了深度对齐(Deliberative Alignment)技术,使其能够在回答用户问题前参考人类撰写的安全规范。安全性评估显示,o3-mini 在应对复杂安全和 “越狱” 测试方面的表现显著优于 GPT-4o。

OpenAI 发布最新推理模型 o3-mini:性能提升,首次向免费用户开放

OpenAI 发布最新推理模型 o3-mini:性能提升,首次向免费用户开放

在正式发布前,OpenAI通过外部团队的测试以及系统性的安全评估对 o3-mini 进行了全面的风险评估,其详细结果及可能的风险缓解措施已在 o3-mini 的系统卡中公布。

相关文章

一段代码让网站出海,这个 AI 翻译工具把多语言 SEO 玩明白了
AI 产品工具
2026年6月1日
0 条评论
小创

一段代码让网站出海,这个 AI 翻译工具把多语言 SEO 玩明白了

跨境电商网站常因语言壁垒导致高跳出率。Weglot 是一款 AI 翻译工具,仅需几分钟即可通过添加脚本实现网站多语言本地化,且保持原有排版。该工具支持可视化编辑、术语表锁定及团队协作,便于后续维护。同时,它能自动优化 hreflang 标签、独立 URL 及元数据,解决多语言 SEO 难题。借助母语内容布局小语种市场,企业可以低成本获取流量红利,有效提升海外转化率。

阅读全文
SCOPE 给 AI 绘画装上了 “语义追踪器”,复杂提示词终于不用反复抽卡了
AI 产品工具
2026年6月1日
0 条评论
零重力瓦力

SCOPE 给 AI 绘画装上了 “语义追踪器”,复杂提示词终于不用反复抽卡了

中科大团队发布 SCOPE 框架,通过结构化语义规格解决 AI 绘画中复杂提示词语义丢失问题。该系统将提示词拆解为实体、约束及未知项,构建包含分解、合成、生成、验证的四步循环,并辅以检索、推理和修复技能,实现生成过程全程可追溯与精准修复。团队还推出 Gen-Arena 评测基准及 EGIP 指标。实验显示 SCOPE 在多项基准中表现优异,为多元素控制场景提供了工程化解决方案,代码已开源。

#AI 绘画
阅读全文
Stable Audio 3.0 发布:开源音频生成从 11 秒走到 6 分钟
AI 产品工具
2026年5月28日
0 条评论
零重力瓦力

Stable Audio 3.0 发布:开源音频生成从 11 秒走到 6 分钟

Stability AI 发布开源音频模型 Stable Audio 3.0,最长可生成 6 分 20 秒立体声音频。该模型采用 SAME 架构实现 4096 倍压缩,支持变量长度生成与局部编辑,Small 版本可在移动端离线运行。训练数据均获授权,规避版权风险。提供四个变体及 LoRA 微调文档,社区许可允许商用。此次升级标志着开源音频生成从短音效迈向完整歌曲创作,为开发者提供了本地化、合规的高质量音频生成方案。

#开源模型#AI 音乐
阅读全文
互动讨论

评论区

围绕《OpenAI 发布最新推理模型 o3-mini:性能提升,首次向免费用户开放》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。