#强化学习
1X 发布最新世界模型,称为机器人 NEO 的认知核心
1X为机器人NEO推出全新世界模型,使其能基于视觉与人类交互视频预训练,在脑中预演符合物理规律的动作,再执行真实操作;支持多方案并行、动态环境适应及自我强化学习闭环,显著提升泛化能力与自主性。
AI 教父 Hinton:AI 不是炒作,反而是被低估了
Hinton指出AI正被严重低估:当前智能体已能自主协作完成网购、规划等真实任务;更关键的是,AI正迈向自我提问、自我修正、自我进化的新阶段,智能跃迁可能超越人类。而人类社会尚未为此做好准备。
DeepSeek-Prover-V2:让数学证明自动化走进现实
DeepSeek-Prover-V2 是基于 Lean 4 的数学自动证明模型,融合思维链、子目标分解与强化学习,能生成可被计算机严格验证的形式化证明。它覆盖竞赛题到高等数学,配套开源基准集 ProverBench,在 MiniF2F 等评测中表现突出,推动数学证明自动化走向实用。
突破时长,无限长度开源 AI 视频生成模型:SkyReels-V2
SkyReels-V2 是首个支持无限长度视频生成的开源模型,首创 Diffusion Forcing 机制实现任意时长无缝续写;在 T2V/I2V 任务中综合性能达开源领先水平,指令遵循性与一致性显著优于同类模型,部分指标媲美 Runway、Kling 等商业系统。
从 ANI 到 AGI:超级对齐如何守护人类未来
AI正从狭义智能(ANI)加速迈向通用(AGI)乃至超级智能(ASI),随之而来的“超级对齐”难题日益紧迫:如何确保远超人类的系统始终服从人类价值观?现有方法如RLHF已显乏力,RLAF、迭代放大等新路径仍在探索中;这不仅是技术挑战,更倒逼人类厘清伦理共识。
来自国产初创公司 Pndbotics 的智能人形机器人:Adam
国产初创公司Pndbotics发布人形机器人Adam系列,含25自由度的Adam Lite与41自由度的Adam SP,均高1.67米、峰值扭矩360N·m;支持基于NVIDIA Isaac Gym的并行深度强化学习训练,强调模块化设计与开放开发能力,面向科研与算法验证场景。
OpenAI Deep Research 团队探讨强化学习为何是智能体的未来
OpenAI Deep Research团队指出,强化学习通过端到端优化直接对齐用户目标,是构建自主智能体的核心路径;其基于o3模型微调的智能体可自主浏览网络、调用工具、生成深度报告,在市场研究、编程等场景已落地,团队预测2025年为“智能体之年”。
2025 年 12 款优秀的大语言模型
2025年12款主流大语言模型全景梳理:涵盖GPT-4o、Gemini、Claude、Llama、Mistral等,突出多模态、开源、轻量部署、强推理等差异化能力,兼顾技术特点与实际应用,反映当前LLM生态的多样性与演进方向。
NEO Gamma:人形机器人即将走进家庭
1X Technologies推出的NEO Gamma是首款进入家庭内测的仿人机器人,采用柔软针织外壳与“情感耳环”设计,支持自然步态、坐卧拾物等拟人动作,并搭载自主语言模型,可理解上下文、多步指令及肢体交互,真正迈向日常陪伴。