萨姆·奥特曼:o1-preview 目前相当于 GPT-2 阶段

奥特曼称o1预览版是AI首个具备“相当高级推理”能力的模型,当前能力类比GPT-2阶段,但预计数月内将快速跃升;它标志着AI从“聊天机器人”迈入“推理器”新范式,并为“智能体”层次奠定基础。

发布于2024年9月19日 09:35
编辑零重力瓦力
评论0
阅读66

OpenAI近日推出了新一代 AI 推理模型 o1,CEO 萨姆·奥特曼在接受采访时详细介绍了该模型的特点及未来发展前景。

奥特曼表示, o1 是首个能够进行 "相当高级推理" 的AI系统。它在处理复杂的编程、数学和科学问题时, 能够给出 "相当出色的结果"。他认为 o1 将开启一系列全新且极具价值的应用场景, 其重要性可与其他 GPT 系列模型相媲美。

目前发布的是 o1 预览版,奥特曼将其比作 GPT-2 的阶段。他预计在未来几个月内, o1 的性能将迅速提升。从预览版到正式版的过程中, 用户将看到 o1 在各方面能力的显著进步。

奥特曼指出, o1 代表了 AI 发展的新范式。他预测它的改进曲线将非常陡峭, 几个月后 o1 就能解决更多目前无法解决的问题,且能力会持续快速提升。

除了模型本身的进步,奥特曼还提到将出现全新的使用方式,不仅限于聊天界面。他表示需要时间来开发新的功能,用户也需要时间来适应 o1 的使用。

奥特曼还将 AI 发展划分为 5 个层次:聊天机器人、推理器、智能体、创新者和完整的组织。他认为 o1 标志着 AI 从第一层次迈向第二层次,更令人兴奋的是它为快速实现第三层次:“智能体”铺平了道路。

相关文章

Claude 自己开机器狗:比人快20 倍,代码量只有十分之一
访谈案例
2026年6月21日
0 条评论
零重力瓦力

Claude 自己开机器狗:比人快20 倍,代码量只有十分之一

Anthropic 实验显示,Claude Opus 4.7 已能全程自主控制机器狗完成任务,速度比人类快约 20 倍,代码量仅为其十分之一。这标志着 AI 智能体正从辅助编程迈向物理工具自主操作阶段。但模型在实时闭环精细控制上仍有局限,且当前成果基于低复杂度任务。该进展体现了通用模型 scaling 的副产物效应,预示物理智能体时代早期来临,但距离解决复杂真实场景仍有差距。

#Claude#AI 编程
阅读全文
JetBrains Junie 正式版:AI 编程 Agent 学会了用调试器断点
AI 编程开发
2026年6月19日
0 条评论
零重力瓦力

JetBrains Junie 正式版:AI 编程 Agent 学会了用调试器断点

JetBrains AI 编程 Agent Junie 正式 GA,在 SWE-Rebench 基准测试中排名第一。其核心优势在于深度集成 IDE 原生工具链,而非模拟替代。主要特性包括:Plan 模式生成结构化计划文档以防跑偏;原生调试器集成支持断点与运行时状态检查;支持异步远程控制长任务;基于项目上下文的交互式代码审查;以及模型自由切换以优化成本。Junie 标志着 AI 编程竞争正从模型能力转向工具集成深度。

#智能体#AI 编程
阅读全文
Visa 把支付网络接进了 ChatGPT,AI 智能体终于能自己花钱了
AI 新闻资讯
2026年6月18日
0 条评论
零重力瓦力

Visa 把支付网络接进了 ChatGPT,AI 智能体终于能自己花钱了

Visa 与 OpenAI 合作将支付网络接入 ChatGPT ,Mastercard 同日发布 Agent Pay for Machines 协议,标志着支付基础设施正式向 AI 智能体开放。Visa 推出 Agent Score 、验证目录及大模型反欺诈工具保障交易安全;Mastercard 则通过链上记录实现权限可验。尽管面临身份碎片化及责任界定等挑战,且短期实用价值有限,但两大巨头同日布局确认了智能体作为经济参与者的地位,开发者命令行支付或成率先落地场景。

#智能体
阅读全文
互动讨论

评论区

围绕《萨姆·奥特曼:o1-preview 目前相当于 GPT-2 阶段》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。