萨姆·奥特曼:o1-preview 目前相当于 GPT-2 阶段

奥特曼称o1预览版是AI首个具备“相当高级推理”能力的模型,当前能力类比GPT-2阶段,但预计数月内将快速跃升;它标志着AI从“聊天机器人”迈入“推理器”新范式,并为“智能体”层次奠定基础。

发布于2024年9月19日 09:35
编辑零重力瓦力
评论0
阅读57

OpenAI近日推出了新一代 AI 推理模型 o1,CEO 萨姆·奥特曼在接受采访时详细介绍了该模型的特点及未来发展前景。

奥特曼表示, o1 是首个能够进行 "相当高级推理" 的AI系统。它在处理复杂的编程、数学和科学问题时, 能够给出 "相当出色的结果"。他认为 o1 将开启一系列全新且极具价值的应用场景, 其重要性可与其他 GPT 系列模型相媲美。

目前发布的是 o1 预览版,奥特曼将其比作 GPT-2 的阶段。他预计在未来几个月内, o1 的性能将迅速提升。从预览版到正式版的过程中, 用户将看到 o1 在各方面能力的显著进步。

奥特曼指出, o1 代表了 AI 发展的新范式。他预测它的改进曲线将非常陡峭, 几个月后 o1 就能解决更多目前无法解决的问题,且能力会持续快速提升。

除了模型本身的进步,奥特曼还提到将出现全新的使用方式,不仅限于聊天界面。他表示需要时间来开发新的功能,用户也需要时间来适应 o1 的使用。

奥特曼还将 AI 发展划分为 5 个层次:聊天机器人、推理器、智能体、创新者和完整的组织。他认为 o1 标志着 AI 从第一层次迈向第二层次,更令人兴奋的是它为快速实现第三层次:“智能体”铺平了道路。

相关文章

微信 AI 智能体终于要来了
AI 新闻资讯
2026年6月3日
0 条评论
零重力瓦力

微信 AI 智能体终于要来了

腾讯正测试微信内嵌 AI 智能体,计划将其打造为连接 14 亿月活与小程序生态的 Agent 操作系统。该产品采用端云混合架构,通过 API 直接调用小程序完成任务,兼具高效与安全优势。尽管面临模型能力与算力瓶颈,且初期或仅覆盖高频基础场景,但凭借零门槛体验和生态闭环,微信有望推动 AI Agent 大众化普及,其最终成效仍取决于模型、算力及服务调用成功率。

#智能体
阅读全文
Windsurf 2.0 拆解:Devin 被塞进编辑器,氛围编程终于有了“调度中心”
AI 编程开发
2026年6月2日
0 条评论
零重力瓦力

Windsurf 2.0 拆解:Devin 被塞进编辑器,氛围编程终于有了“调度中心”

Cognition 发布 Windsurf 2.0,深度整合 Devin 实现本地思考与云端执行分工。新版推出 Agent Command Center 支持多智能体可视化管理,搭载自研 SWE-1.5 模型大幅提升代码定位与编辑速度,并引入 Spaces 容器解决上下文延续问题。Pro 版调整为日配额制且包含 Devin 功能。相比 Cursor 3,Windsurf 2.0 凭借自研模型与云端执行能力,更适合处理陌生代码库及长任务自动化场景。

#智能体#AI 编程
阅读全文
多智能体为什么比单智能体强?Anthropic 用 90.2% 的数据给了答案
智能体工程
2026年6月2日
0 条评论
零重力瓦力

多智能体为什么比单智能体强?Anthropic 用 90.2% 的数据给了答案

Anthropic 研究显示,多智能体系统性能比单智能体提升 90.2%,其核心在于主智能体拆解任务与子智能体并行执行。尽管该架构 token 消耗约为单智能体的 15 倍,但在复杂任务中优势显著。业界已总结出五种协作模式,并有 n8n、CAMEL-AI 等落地案例。然而,多智能体仍面临调试难、输出不稳定等挑战。建议仅在任务复杂需并行、分工明确且能承担高成本时采用,简单任务直接使用强模型即可。

#智能体#智能体工程
阅读全文
互动讨论

评论区

围绕《萨姆·奥特曼:o1-preview 目前相当于 GPT-2 阶段》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。