资讯标签
资讯首页/#强化学习

#强化学习

1X 发布最新世界模型,称为机器人 NEO 的认知核心
AI 新闻资讯
2026年1月20日
0 条评论
零重力瓦力

1X 发布最新世界模型,称为机器人 NEO 的认知核心

1X为机器人NEO推出全新世界模型,使其能基于视觉与人类交互视频预训练,在脑中预演符合物理规律的动作,再执行真实操作;支持多方案并行、动态环境适应及自我强化学习闭环,显著提升泛化能力与自主性。

#世界模型#具身智能#强化学习
阅读全文
AI 教父 Hinton:AI 不是炒作,反而是被低估了
访谈案例
2026年1月12日
0 条评论
零重力瓦力

AI 教父 Hinton:AI 不是炒作,反而是被低估了

Hinton指出AI正被严重低估:当前智能体已能自主协作完成网购、规划等真实任务;更关键的是,AI正迈向自我提问、自我修正、自我进化的新阶段,智能跃迁可能超越人类。而人类社会尚未为此做好准备。

#智能体#强化学习
阅读全文
DeepSeek-Prover-V2:让数学证明自动化走进现实
AI 产品工具
2025年5月3日
0 条评论
零重力瓦力

DeepSeek-Prover-V2:让数学证明自动化走进现实

DeepSeek-Prover-V2 是基于 Lean 4 的数学自动证明模型,融合思维链、子目标分解与强化学习,能生成可被计算机严格验证的形式化证明。它覆盖竞赛题到高等数学,配套开源基准集 ProverBench,在 MiniF2F 等评测中表现突出,推动数学证明自动化走向实用。

#DeepSeek#思维链#强化学习
阅读全文
突破时长,无限长度开源 AI 视频生成模型:SkyReels-V2
AI 新闻资讯
2025年4月22日
0 条评论
零重力瓦力

突破时长,无限长度开源 AI 视频生成模型:SkyReels-V2

SkyReels-V2 是首个支持无限长度视频生成的开源模型,首创 Diffusion Forcing 机制实现任意时长无缝续写;在 T2V/I2V 任务中综合性能达开源领先水平,指令遵循性与一致性显著优于同类模型,部分指标媲美 Runway、Kling 等商业系统。

#视频生成#强化学习#多模态
阅读全文
从 ANI 到 AGI:超级对齐如何守护人类未来
AI 教程知识
2025年3月13日
0 条评论
零重力瓦力

从 ANI 到 AGI:超级对齐如何守护人类未来

AI正从狭义智能(ANI)加速迈向通用(AGI)乃至超级智能(ASI),随之而来的“超级对齐”难题日益紧迫:如何确保远超人类的系统始终服从人类价值观?现有方法如RLHF已显乏力,RLAF、迭代放大等新路径仍在探索中;这不仅是技术挑战,更倒逼人类厘清伦理共识。

#强化学习#AI 模型
阅读全文
来自国产初创公司 Pndbotics 的智能人形机器人:Adam
AI 新闻资讯
2025年3月9日
0 条评论
零重力瓦力

来自国产初创公司 Pndbotics 的智能人形机器人:Adam

国产初创公司Pndbotics发布人形机器人Adam系列,含25自由度的Adam Lite与41自由度的Adam SP,均高1.67米、峰值扭矩360N·m;支持基于NVIDIA Isaac Gym的并行深度强化学习训练,强调模块化设计与开放开发能力,面向科研与算法验证场景。

#机器人#强化学习
阅读全文
OpenAI Deep Research 团队探讨强化学习为何是智能体的未来
AI 新闻资讯
2025年2月27日
0 条评论
零重力瓦力

OpenAI Deep Research 团队探讨强化学习为何是智能体的未来

OpenAI Deep Research团队指出,强化学习通过端到端优化直接对齐用户目标,是构建自主智能体的核心路径;其基于o3模型微调的智能体可自主浏览网络、调用工具、生成深度报告,在市场研究、编程等场景已落地,团队预测2025年为“智能体之年”。

#OpenAI#智能体#强化学习
阅读全文
2025 年 12 款优秀的大语言模型
AI 产品工具
2025年2月26日
0 条评论
零重力瓦力

2025 年 12 款优秀的大语言模型

2025年12款主流大语言模型全景梳理:涵盖GPT-4o、Gemini、Claude、Llama、Mistral等,突出多模态、开源、轻量部署、强推理等差异化能力,兼顾技术特点与实际应用,反映当前LLM生态的多样性与演进方向。

#AI 模型#多模态#强化学习
阅读全文
NEO Gamma:人形机器人即将走进家庭
AI 新闻资讯
2025年2月22日
0 条评论
零重力瓦力

NEO Gamma:人形机器人即将走进家庭

1X Technologies推出的NEO Gamma是首款进入家庭内测的仿人机器人,采用柔软针织外壳与“情感耳环”设计,支持自然步态、坐卧拾物等拟人动作,并搭载自主语言模型,可理解上下文、多步指令及肢体交互,真正迈向日常陪伴。

#具身智能#机器人#强化学习
阅读全文
17 篇文章,第 1 / 2