《华尔街日报》对 OpenAI 工程部门副总裁 Srinivas 的采访

OpenAI工程副总裁Srinivas详解AI推理能力对AGI的关键意义,介绍o1/o3-mini在医疗、金融等领域的实际应用;回应DeepSeek冲击与开源争议,强调企业定制化、数据安全及Stargate基建计划——AI正从模型走向可执行的智能体。

发布于2025年2月13日 05:37
编辑零重力瓦力
评论0
阅读51

《华尔街日报》对 OpenAI 工程部副总裁 Srinivas 进行了了采访,提到了 AI 的推理能力、DeepSeek 对 OpenAI 带来的冲击、OpenAI 是否会开源,以及 5000 亿的 Stargate 计划,等大家关注的问题,信息量颇大。

Srinivas 首先对 AI 的推理能力,进行了较为详细的科普,他解释,推理是 AI 解决复杂问题的能力,类似于人类思考难题所需的时间和步骤。能否有效推理也是 AI 迈向通用人工智能(AGI)的关键之一。他介绍了 OpenAI 近期发布的推理模型,如 o1 和 o3-mini,并介绍了它们在医疗、金融、生物科学等领域的应用。例如,Oscar Health 用它来分析病人治疗效果,生物研究机构用它来预测临床试验结果,Berkeley 国家实验室则尝试用 AI 研究基因突变与罕见疾病的关系,总之 AI 推理的应用范围将越来越广,作用越来越大。

此外,Srinivas 介绍了 OpenAI 最新推出的智能体(AI Agents),如 Operator 和 Deep Research。Operator 旨在帮助用户自动执行日常计算机任务,比如预订餐厅,而 Deep Research 则可以代表用户进行信息检索和研究。他强调,这些智能体仍处于早期阶段,OpenAI 正在观察和学习用户如何使用它们,以便进一步优化。

关于 AI 发展的成本问题,他提到 AI 训练成本正在快速下降,比如 GPT-4 的成本在短短几年内降低了 150 倍。同时,他也回应了 DeepSeek R1 模型对 OpenAI 带来的影响,认为这只是 AI 发展趋势的一部分,OpenAI 也会持续优化模型的性价比。他还提到训练单一模型的成本和一个能够持续产出研究创新成果系统所需的成本不是一个概念。

针对 OpenAI 是否会开源 o1、o3 这些模型,Srinivas 表示公司内部正在讨论,但强调企业用户更关心的是 AI 的易用性、定制化能力和成本效益,而不仅仅是模型是否开源。同时,他也提到了 OpenAI 在定制 AI 方面的努力,比如强化微调(Reinforcement Fine-Tuning),让企业可以用少量示例微调 AI,使其更符合自身需求。

关于 OpenAI 计划与软银、甲骨文合作的 AI 基础设施项目 Stargate,他指出更强的计算能力可以推动 AI 进步,使其更智能、更便宜,从而创造出更多应用场景。他认为 AI 未来的影响可能会像电力革命一样深远,需要庞大的基础设施支撑。

在被问及 OpenAI 内部如何使用自己的 AI 时,他提到团队广泛使用 ChatGPT 进行编程、代码调试、知识管理、法律合同分析、客户支持等。此外,他还强调 OpenAI 非常重视企业客户的数据安全,明确表示不会使用用户数据来训练模型。

最后,他谈到了 AI 智能体未来的发展方向,认为它们不会仅限于浏览器操作,而是会扩展到整个计算机环境。他表示,OpenAI 仍在学习和改进这些技术,以确保 AI 在获得用户许可的情况下代表用户执行更广泛的任务。

相关文章

Windsurf 2.0 拆解:Devin 被塞进编辑器,氛围编程终于有了“调度中心”
AI 编程开发
2026年6月2日
0 条评论
零重力瓦力

Windsurf 2.0 拆解:Devin 被塞进编辑器,氛围编程终于有了“调度中心”

Cognition 发布 Windsurf 2.0,深度整合 Devin 实现本地思考与云端执行分工。新版推出 Agent Command Center 支持多智能体可视化管理,搭载自研 SWE-1.5 模型大幅提升代码定位与编辑速度,并引入 Spaces 容器解决上下文延续问题。Pro 版调整为日配额制且包含 Devin 功能。相比 Cursor 3,Windsurf 2.0 凭借自研模型与云端执行能力,更适合处理陌生代码库及长任务自动化场景。

#智能体#AI 编程
阅读全文
多智能体为什么比单智能体强?Anthropic 用 90.2% 的数据给了答案
智能体工程
2026年6月2日
0 条评论
零重力瓦力

多智能体为什么比单智能体强?Anthropic 用 90.2% 的数据给了答案

Anthropic 研究显示,多智能体系统性能比单智能体提升 90.2%,其核心在于主智能体拆解任务与子智能体并行执行。尽管该架构 token 消耗约为单智能体的 15 倍,但在复杂任务中优势显著。业界已总结出五种协作模式,并有 n8n、CAMEL-AI 等落地案例。然而,多智能体仍面临调试难、输出不稳定等挑战。建议仅在任务复杂需并行、分工明确且能承担高成本时采用,简单任务直接使用强模型即可。

#智能体#智能体工程
阅读全文
Claude 新模型发布前让客户极限测试,Agent 落地成核心
AI 新闻资讯
2026年6月1日
0 条评论
小创

Claude 新模型发布前让客户极限测试,Agent 落地成核心

Anthropic 在发布新 Claude 模型前,通过头部客户极限测试验证真实业务表现,比单纯跑分更具参考价值。借助 Agent 能力,新模型在起草法律文件等复杂任务中成功率提升约 20%,实现持续准确输出。当前大模型发展重心已转向 Agent 在垂直场景的落地,边缘案例为下一代优化指明方向。这种与客户深度共创的模式建立了高信任壁垒,值得产品团队借鉴。

#Anthropic#智能体
阅读全文
互动讨论

评论区

围绕《《华尔街日报》对 OpenAI 工程部门副总裁 Srinivas 的采访》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。