Gemini 机器人具身智能 1.6

Google DeepMind 发布 Gemini Robotics-ER 1.6 推理模型，专为机器人应用设计。该模型在空间逻辑、多视角理解和任务规划能力上实现突破，新增复杂工业仪表读数功能，得益于与 Boston Dynamics 的深度合作。安全性方面表现突出，成为 Google 最安全的机器人模型。此次发布表明大语言模型正加速向物理世界渗透， Google 以空间智能为切入点务实布局，而 Boston Dynamics 在真实环境部署方面的经验恰好弥补了互联网公司的短板。

发布于2026年4月15日 09:16

编辑小创

评论0 条

阅读147

#Google #Gemini #具身智能

Google DeepMind 正式推出 Gemini Robotics-ER 1.6 ，这是一款专为机器人应用设计的推理优先模型升级版本。通过增强空间逻辑和多视角理解能力，该模型使机器人能够以前所未有的精度感知和理解周围环境。

Gemini Robotics-ER 1.6 在多项关键技术指标上实现突破。在视觉和空间理解方面，模型能够准确解析复杂的三维场景；在任务规划领域，系统可自主生成并执行多步骤操作序列；在成功检测环节，模型能够实时评估任务完成状态并做出相应调整。

值得关注的是，这款模型还新增了仪器读数能力，可读取复杂的工业仪表和视镜。这一功能的实现得益于与 Boston Dynamics 的深度合作。 Boston Dynamics 在足式机器人领域的丰富经验，为模型在非结构化环境中的适应性提供了重要支撑。

安全性能方面， Gemini Robotics-ER 1.6 同样达到新高。测试数据显示，该模型在应对对抗性空间推理任务时，展现出对安全策略的卓越遵从能力，目前已成为 Google 最安全的机器人模型。

即日起，开发者可通过 Gemini API 和 Google AI Studio 访问该模型。

创艺洞察

Gemini Robotics-ER 1.6 的发布，标志着大语言模型向物理世界渗透的进程正在加速。与单纯追求语言能力的参数竞赛不同， Google 选择了一条更务实的路径，将空间智能作为切入点。仪器读数能力的加入尤其值得注意，它意味着机器人在工业场景中的落地不再是理论构想。然而，从展示能力到可靠部署之间，仍横亘着漫长的调试与优化周期。 Boston Dynamics 的参与或许正是为了弥补这一断层。后者在真实环境部署方面的积累，恰是互联网公司所缺乏的。

GPT-5.6 Sol Ultra 1 小时证明 60 年未解的图论猜想

OpenAI 旗下 GPT-5.6 Sol Ultra 通过 64 路并行 agent 在 1 小时内生成了图论 CDC 猜想的证明文本，成本不足 500 美元。该成果引发争议，因缺乏 Lean 机械化验证、未公开完整推理轨迹及受限于图论形式化库不成熟，数学界对其有效性存疑。此事表明 LLM 已具备启发式数学搜索能力，但验证基础设施滞后仍是瓶颈。未来“多路并行+防放弃 prompt”或成范式，而完善 Lean 工具链是确立 AI 证明可信度的关键。

AI 正在翻译细胞语言，阿尔茨海默症迎来新转机

针对复杂疾病治疗难题，Arc 研究所正利用 AI 构建通用“虚拟细胞”模型。该模型将 RNA 表达视为生命语言，计划四年内通过 CRISPR 和单细胞测序完成 10 亿次实验进行训练。研究人员可借此在电脑模拟中预测基因或化学干预方案，实现从盲目猜测到精准预测的转变。该工具将于今年晚些时候开源，有望在未来四五年内推动个性化医疗及复杂疾病治疗取得临床突破。

Google 为何要开发 Gemma 4 模型

谷歌推出开源模型 Gemma 4，旨在解决网络受限地区无法使用前沿 AI 的问题。该模型追求内存占用下的智能最大化，首次具备多模态与智能体能力，支持在无网移动端高效运行复杂任务。目前已在乌干达离线医疗系统及秘鲁原住民语言保护等场景中落地应用。通过将大模型蒸馏至终端设备，Gemma 4 摆脱了对云端算力的依赖，推动去中心化开源生态发展，赋能各社区按需构建专属系统。

#开源模型#Google#Gemma

阅读全文

互动讨论

评论区

围绕《Gemini 机器人具身智能 1.6》展开交流，未登录用户可浏览评论，登录后可参与讨论。

评论数

登录后参与评论

支持发表观点与回复一级评论，互动后将同步到消息中心。

登录后评论

暂无评论，欢迎成为第一个参与讨论的人。

Gemini 机器人具身智能 1.6

创艺洞察

相关文章

GPT-5.6 Sol Ultra 1 小时证明 60 年未解的图论猜想

AI 正在翻译细胞语言，阿尔茨海默症迎来新转机

Google 为何要开发 Gemma 4 模型

评论区