OpenAI 正式发布了两款开放权重大型语言模型

OpenAI 五年来首次开放模型权重,发布 gpt-oss-120b 与 gpt-oss-20b 两款 MoE 架构大模型,支持代码生成、数学推理等任务;前者可在单卡 GPU 运行,后者适配笔记本;Apache 2.0 开源,已上线 Amazon Bedrock 与 SageMaker。

发布于2025年8月6日 03:19
编辑零重力瓦力
评论0
阅读21

OpenAI 正式发布了两款开放权重大型语言模型

OpenAI 正式发布了两款开放权重的大型语言模型:gpt-oss-120b 和 gpt-oss-20b。这是自 GPT-2 以来,OpenAI 时隔五年再次向公众开放模型权重,并首次在 Amazon Bedrock 与 SageMaker 平台同步上线。此次发布不仅回应了开发者社群和业界对开放模型的长期呼声,也体现了 OpenAI 在全球人工智能开源竞赛中态度的转变。

与早期的开源模型不同,gpt-oss 系列聚焦于推理能力和实际落地场景,强调在代码生成、多步逻辑推理、科学分析、数学问题等任务上的表现。尤其是 120b 参数的 gpt-oss-120b,能够在一块Nvidia 80GB GPU上运行,极大降低了高性能模型的使用门槛。20b 版本则可在消费级设备如笔记本电脑上部署,使个人开发者也能轻松上手。

gpt-oss on Ollama

在性能上,根据 OpenAI 和第三方基准测试,gpt-oss-120b 在 Codeforces 等编程能力测试上超越了 DeepSeek R1 等开源竞品,仅次于 OpenAI 自家的 o3、o4-mini 等最新专有模型。在 Humanity’s Last Exam 等通用推理任务上,gpt-oss 系列也展现出领先的综合实力。不过,和更大规模的专有模型相比,开放权重模型在 “幻觉率” 上仍有提升空间。例如在 PersonQA 等知识准确性测试中,gpt-oss 系列的回答错误率高于 OpenAI 最新的闭源模型。这一现象也被 OpenAI 称之为 “模型规模的限制”,并非完全可控。

gpt-oss on Codeforces

gpt-oss on On Humanity’s Last Exam (HLE)

gpt-oss 系列采用了混合专家(Mixture-of-Experts, MoE)架构,每次仅激活部分子网络以提高效率和推理深度,但具体的路由机制等关键细节并未公开。OpenAI 强调本次开放只涉及已知的技术组件,未披露专有算法与训练方法,以避免知识产权泄露。这一策略平衡了技术共享与商业安全,也与 Meta、Mistral 等公司的做法趋同。

此次发布还 OpenAI 再次强调了他们对安全性的重视。OpenAI 不仅在训练和微调过程中加入了高强度的安全机制,还专门评估了模型在网络安全、生物和化学领域的潜在风险。即便如此,仍有业内观点认为,开放权重模型的可控性和可追溯性将成为行业持续关注的重点。

从应用层面看,gpt-oss 系列的到来极大丰富了云端 AI 模型的生态。通过 Amazon Bedrock 和 SageMaker,开发者和企业能够在安全、合规的环境下进行模型定制、评估和大规模部署。这一开放不仅有助于推动 AI 技术在科研、工业、金融、医疗等行业的创新应用,也为全球开发者提供了更多选择,开放权重模型有望成为未来通用人工智能基础设施的一部分。

OpenAI 此次选择 Apache 2.0 等宽松开源协议,允许企业级用户在不额外授权或支付费用的前提下进行商业化落地。但与部分 “完全开放源代码” 项目不同,OpenAI 仍未公布数据集详情。

总的来说,OpenAI 的 gpt-oss 系列既回应了开发者和市场对高性能开放模型的期待,也反映了大模型时代下,开源与专有、创新与安全之间复杂的动态平衡。未来,随着DeepSeek R2、Meta 新一代模型等竞品的陆续登场,开放权重模型的技术路线、产业标准与治理规范,或将成为通用人工智能领域持续演进的关键看点。

参考链接

  1. OpenAI launches its first open model in years so it can stop being on the ‘wrong side of history’—while still keeping its most valuable IP under wraps
  2. OpenAI open weight models available today on AWS
  3. OpenAI launches two ‘open’ AI reasoning models

相关文章

Mistral 把编程 Agent 扔进云里
AI 编程开发
2026年5月12日
0 条评论
零重力瓦力

Mistral 把编程 Agent 扔进云里

Mistral 推出 Medium 3.5 开源模型与 Vibe 远程代理,将编程协作从“人机同步”转向“异步委派”。128B 稠密模型以 77.6% 的 SWE-Bench 成绩超越 Claude Sonnet 4,支持自部署。Vibe 允许开发者在云端沙箱并行运行多个任务,自动提交 PR 并通知审查。配合 Le Chat 通用工作模式,该方案适合追求效率的团队及关注数据安全的独立开发者,重新定义了 AI 辅助编码的工作流。

#Mistral#开源模型#AI 编程
阅读全文
ChatGPT 开始卖广告了,但 OpenAI 真正的野心在语音
AI 新闻资讯
2026年5月8日
0 条评论
小创

ChatGPT 开始卖广告了,但 OpenAI 真正的野心在语音

5 月 7 日,OpenAI 在英、巴等五国启动 ChatGPT 广告内测,并推出三款具备 GPT-5 级推理能力的实时语音模型。广告业务强调隐私与回答独立性,旨在探索免费用户变现路径。新语音模型则支持复杂任务操作,加速企业付费场景落地。此举标志 OpenAI 从技术验证转向商业模式规模化,证明 AI 产品可兼顾用户体验与多元盈利,为行业商业化提供了关键风向标。

#OpenAI
阅读全文
ChatGPT Images 2.0 在印度受热捧,但目前在其他地方尚未大获成功
AI 新闻资讯
2026年5月5日
0 条评论
小创

ChatGPT Images 2.0 在印度受热捧,但目前在其他地方尚未大获成功

虽然 OpenAI 声称印度成为 ChatGPT Images 2.0 最大用户市场,但第三方数据显示全球增长实则温和,下载量仅增 11%,日活和流量涨幅约 1%。巴基斯坦、越南、印尼等新兴市场反而出现高达 79%的下载增长。印度用户主要将该功能用于个人表达场景,如风格化肖像、社交头像等,反映出 AI 图像工具在不同市场的落地方式存在差异。

#OpenAI
阅读全文
互动讨论

评论区

围绕《OpenAI 正式发布了两款开放权重大型语言模型》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。