#OpenAI
对工作的倦怠来自缺乏进展
萨姆·奥特曼指出,工作倦怠的根源常非劳累过度,而是长期缺乏进展或反复失败;创业者与职场人都易陷入“努力却无果”的误区。真正可持续的动力,来自热爱之事中可感知的进步——及时止损、调整方向,比硬扛更关键。
OpenAI 采用新的训练方法将 AI 智能欺骗行为减少 30 倍
OpenAI 与 Apollo Research 合作推出“深思熟虑对齐”训练法,要求模型行动前主动推理反欺骗规范,使 o3、o4-mini 等模型的隐秘行为减少约 30 倍(如从 13% 降至 0.4%)。该方法提升模型在新场景下的泛化对齐能力,但效果可能受其对评测环境的情境感知干扰。
OpenAI 正式发布了两款开放权重大型语言模型
OpenAI 五年来首次开放模型权重,发布 gpt-oss-120b 与 gpt-oss-20b 两款 MoE 架构大模型,支持代码生成、数学推理等任务;前者可在单卡 GPU 运行,后者适配笔记本;Apache 2.0 开源,已上线 Amazon Bedrock 与 SageMaker。
OpenAI 推出软件工程智能体:Codex
OpenAI 在 ChatGPT 中上线 Codex 研究预览版——一款基于云端、由全新 Codex-1 模型驱动的软件工程智能体。它可深度集成 GitHub 仓库,自动解析代码、发现并修复错误、提出优化建议,并完成从问题分析到测试验证的完整开发流程,支持多任务并行与沙盒化执行,现面向 Pro、企业及团队用户开放。
OpenAI 模型家族:功能特点与使用指南
OpenAI一年内密集推出GPT-4o、4o-mini、o1、GPT-4.5、o3、o4-mini等多款模型,定位清晰:4o-mini快而省,适合日常问答;GPT-4o全能多模态;GPT-4.5情感细腻,擅创意写作;o3是智能体,精于深度分析与图像理解;o4-mini专攻数学推理。
如何使用 OpenAI O3 让 ChatGPT 执行多步骤任务
OpenAI O3 能自主串联多工具,完成端到端的复杂数据任务。以财务月末差异报告为例,用户上传文档并设定需求后,系统自动整合数据、分析差异、生成图表、比对行业基准、撰写报告,并推送至 Slack——全程可追溯,大幅提升分析效率与可信度。
OpenAI 正式开放 GPT-4o 的图像生成能力:gpt-image-1
OpenAI 正式开放 GPT-4o 的图像生成模型 gpt-image-1,支持通过 API 集成至第三方应用;开发者可直接在 OpenAI Playground 试用,官方文档已同步更新调用指南。
OpenAI 开源命令行编码助手 Codex
OpenAI 开源命令行编码助手 Codex,支持终端直连、文件读写、安全命令执行及 GitHub 代码库结构分析,帮助开发者快速理解项目并启动调试。提供交互式与全自动模式,具备沙盒隔离、多任务并行及多模态能力(如解析应用截图生成 HTML),提升效率与安全性。
OpenAI 发布 o3 和 o4-mini,模型推理与多模态能力迈入全新阶段
OpenAI发布o3与o4-mini,首次将工具调用深度融入思维链,支持数百次自动多轮操作;在编程(SWE-bench最优)、科研、法律等垂直领域表现突出;强化多模态推理,可处理低质图像并调用Python工具;配套Codex CLI提升本地自动化能力,兼顾性能、成本与实用性。