资讯标签

资讯首页/#强化学习

#强化学习

AI 新闻资讯

2026年1月20日

0 条评论

零重力瓦力

1X 发布最新世界模型，称为机器人 NEO 的认知核心

1X为机器人NEO推出全新世界模型，使其能基于视觉与人类交互视频预训练，在脑中预演符合物理规律的动作，再执行真实操作；支持多方案并行、动态环境适应及自我强化学习闭环，显著提升泛化能力与自主性。

AI 教父 Hinton：AI 不是炒作，反而是被低估了

Hinton指出AI正被严重低估：当前智能体已能自主协作完成网购、规划等真实任务；更关键的是，AI正迈向自我提问、自我修正、自我进化的新阶段，智能跃迁可能超越人类。而人类社会尚未为此做好准备。

DeepSeek-Prover-V2：让数学证明自动化走进现实

DeepSeek-Prover-V2 是基于 Lean 4 的数学自动证明模型，融合思维链、子目标分解与强化学习，能生成可被计算机严格验证的形式化证明。它覆盖竞赛题到高等数学，配套开源基准集 ProverBench，在 MiniF2F 等评测中表现突出，推动数学证明自动化走向实用。

突破时长，无限长度开源 AI 视频生成模型：SkyReels-V2

SkyReels-V2 是首个支持无限长度视频生成的开源模型，首创 Diffusion Forcing 机制实现任意时长无缝续写；在 T2V/I2V 任务中综合性能达开源领先水平，指令遵循性与一致性显著优于同类模型，部分指标媲美 Runway、Kling 等商业系统。

从 ANI 到 AGI：超级对齐如何守护人类未来

AI正从狭义智能（ANI）加速迈向通用（AGI）乃至超级智能（ASI），随之而来的“超级对齐”难题日益紧迫：如何确保远超人类的系统始终服从人类价值观？现有方法如RLHF已显乏力，RLAF、迭代放大等新路径仍在探索中；这不仅是技术挑战，更倒逼人类厘清伦理共识。

来自国产初创公司 Pndbotics 的智能人形机器人：Adam

国产初创公司Pndbotics发布人形机器人Adam系列，含25自由度的Adam Lite与41自由度的Adam SP，均高1.67米、峰值扭矩360N·m；支持基于NVIDIA Isaac Gym的并行深度强化学习训练，强调模块化设计与开放开发能力，面向科研与算法验证场景。

OpenAI Deep Research 团队探讨强化学习为何是智能体的未来

OpenAI Deep Research团队指出，强化学习通过端到端优化直接对齐用户目标，是构建自主智能体的核心路径；其基于o3模型微调的智能体可自主浏览网络、调用工具、生成深度报告，在市场研究、编程等场景已落地，团队预测2025年为“智能体之年”。

2025 年 12 款优秀的大语言模型

2025年12款主流大语言模型全景梳理：涵盖GPT-4o、Gemini、Claude、Llama、Mistral等，突出多模态、开源、轻量部署、强推理等差异化能力，兼顾技术特点与实际应用，反映当前LLM生态的多样性与演进方向。

NEO Gamma：人形机器人即将走进家庭

1X Technologies推出的NEO Gamma是首款进入家庭内测的仿人机器人，采用柔软针织外壳与“情感耳环”设计，支持自然步态、坐卧拾物等拟人动作，并搭载自主语言模型，可理解上下文、多步指令及肢体交互，真正迈向日常陪伴。

#具身智能#机器人#强化学习

阅读全文

共 17 篇文章，第 1 / 2 页