1X 发布最新世界模型,称为机器人 NEO 的认知核心

1X为机器人NEO推出全新世界模型,使其能基于视觉与人类交互视频预训练,在脑中预演符合物理规律的动作,再执行真实操作;支持多方案并行、动态环境适应及自我强化学习闭环,显著提升泛化能力与自主性。

发布于2026年1月20日 14:31
编辑零重力瓦力
评论0
阅读31

人形机器人公司 1X 发布最新的世界模型,并成为自家人形智能机器人 NEO 的认知核心。

为什么 1X 世界模型如此重要?因为它让机器人 Neo 不再只是根据固定程序或单一模型行动,而是能先 “想一想” 再去做。你给 Neo 一个语音或文字提示,它会基于当前看到的环境,在内部生成一段符合物理规律的 “未来动作演示”,相当于先在脑中预演接下来要怎么动,然后再把这些结果转化为真实的身体运动。

这个能力的关键在于训练方式。世界模型先在互联网规模的人类交互视频上预训练,学习人类如何与世界互动,再用机器人数据进行后训练,把这种理解和真实物理规律、Neo 的人形结构结合起来。这样一来,Neo 不只是记住动作,而是学会了 “为什么可以这么做”。

因此,Neo 能泛化到很多从未见过的任务。比如把橙子放进午餐盒,或者操作从没见过的马桶盖。这并不是因为训练集中正好有类似案例,而是世界模型让它能把已有的人类知识迁移到新物体、新场景中,只要符合基本物理逻辑,它就能尝试。

世界模型在复杂、不可预测的环境中也很有优势。传统机器人系统往往对光照变化、杂乱背景或随机物体非常敏感,而 1X 世界模型更像人类那样理解环境整体结构,能在高度动态的情况下继续行动,而不会轻易 “失效”。

在实际使用中,Neo 可以并行生成多种执行方案,由系统自动选择,或者由人来挑选最合适的一种再执行。这让机器人不再是一次性决策,而是具备一定的试探和选择能力。

当然,这项技术还在进化中。当前每次自主动作的持续时间和成功率仍有提升空间。但一个重要变化已经出现!Neo 可以通过执行真实任务,不断生成新的数据,用来反过来训练自己,形成自我强化的学习循环。

从这个角度看,世界模型不只是一个更强的控制系统,而是一种新的机器人学习方式。它把“想象”、“行动” 和 “学习” 连成了一条闭环,也让机器人从依赖人工示范,逐步走向真正的自我学习。这可能是机器人和 AI 发展的一个重要转折点。

相关文章

三种记忆模式解决 AI 智能体的金鱼记忆
AI 新闻资讯
2026年5月12日
0 条评论
小创

三种记忆模式解决 AI 智能体的金鱼记忆

很多 AI 智能体表现“迟钝”,往往并非模型能力不足,而是缺乏记忆机制。Google 技术专家基于 ADK 提出三种解决方案:会话记忆让助手在单次对话中记住上下文;多智能体状态共享支持多个智能体通过键值对协作传递信息;持久化存储则利用数据库替代内存,使智能体能跨越重启记录用户偏好。这些方法能有效解决“金鱼记忆”问题,帮助开发者构建更连贯、具备长期服务能力的个人助理应用。

#智能体工程
阅读全文
ChatGPT 开始卖广告了,但 OpenAI 真正的野心在语音
AI 新闻资讯
2026年5月8日
0 条评论
小创

ChatGPT 开始卖广告了,但 OpenAI 真正的野心在语音

5 月 7 日,OpenAI 在英、巴等五国启动 ChatGPT 广告内测,并推出三款具备 GPT-5 级推理能力的实时语音模型。广告业务强调隐私与回答独立性,旨在探索免费用户变现路径。新语音模型则支持复杂任务操作,加速企业付费场景落地。此举标志 OpenAI 从技术验证转向商业模式规模化,证明 AI 产品可兼顾用户体验与多元盈利,为行业商业化提供了关键风向标。

#OpenAI
阅读全文
让 AI 视频拥有电影质感的九层结构提示词
AI 新闻资讯
2026年5月8日
0 条评论
小创

让 AI 视频拥有电影质感的九层结构提示词

如何让 AI 视频拥有电影质感?提示词应采用导演语言而非被动描述,需包含主体、微动作、环境、摄像机、灯光、风格、情绪、物理细节、渲染质量九层结构。文章还总结了微动作工程、摄像机定义、布光逻辑、情绪编码及可控混乱等策略,并提供了多条完整示例。创作者需注意框架易致同质化,真正的竞争壁垒在于对细节分寸和不可模板化判断的把握。

#Runway#视频生成
阅读全文
互动讨论

评论区

围绕《1X 发布最新世界模型,称为机器人 NEO 的认知核心》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。