MIT 教授探索类人智能的奥秘

MIT副教授Phillip Isola通过心理物理学实验与视频预测等生成模型,探索人类如何直觉理解物理世界、推断物体功能并预测事件;其研究强调AI与人类认知的双向启发,旨在揭示智能本质的多样性。

发布于2025年11月11日 09:44
编辑零重力瓦力
评论0
阅读49

MIT 教授探索类人智能的奥秘

MIT 电气工程与计算机科学系副教授 Phillip Isola 致力于开发能够执行类人任务的模型,比如预测即将发生的事件,或想象物体被操作时的状态变化。

Isola 认为,通过研究这些模型的运作机理,研究人员能够更深入地理解人类的感知和认知能力。他表示,构建更优秀的智能系统模型,能够帮助我们更好地理解自身的智能。而对自身智能的深入理解,反过来又能促进更出色的人工智能系统的构建。这两者能够形成良性互动。

视觉感知的基础能力

Isola 的研究重点关注人类如何识别场景中的物体及其相互关系。他认为,这是最基础的视觉能力,一旦掌握了它,就能完成各种后续任务。

他的研究探讨了人类如何学会识别新物体,即便此前只见过寥寥几次。他还研究了 “功能性” 概念,即通过物体的外观推断其用途的能力。比如,即使从未见过某个特定的杯子,人们也能推断出可以用它来盛水。

为了研究这些现象,Isola 设计心理物理学实验来测试人类受试者,随后训练计算模型执行相同的任务。他说,思路是建立人类完成这些任务的模型,然后深入剖析模型内部,试图理解其工作机制,以此来推测人类可能采用的类似方式。

生成模型:预测未来的能力

目前,Isola 的实验室主要专注于 “生成模型” 研究——这类模型经过训练后能够生成新的数据,如图像或视频。DALL-E 就是这类模型的一个知名案例。

Isola 及其学生正在研究的视频预测模型能够预测视频接下来将会发生什么。这些模型在大量展示人与物体互动或物体之间相互作用的视频上进行训练。训练完成后,即使面对从未见过的类似场景,模型也能进行预测。

Isola 说,核心思想是,如果模型能够预测接下来会发生什么,那么它必然学习到了关于世界运作方式的某些知识。

这种预测未来的能力对机器人技术尤为重要,因为机器人需要能够预测在操纵物体或在环境中移动时会产生什么结果。Isola 认为,这类模型有助于揭示人类进行此类预测的机制。

他表示,人类在预测事物方面显然非常出色,我们时刻都在进行预测。当伸手去拿咖啡杯时,就会预测移动手臂会产生什么结果。研究团队希望更深入地理解这在人类大脑中是如何运作的,以及如何在机器中复现这种能力。

直觉物理学:无师自通的理解

Isola 的另一个研究方向是 “直觉物理学”,即人类理解物理世界运作规律的能力。即使没有接受过正式的物理学教育,人类也能很好地预测,比如从桌边推开一个杯子会发生什么。

他说,我们对物理学拥有良好的直觉,研究团队想要了解这种直觉的来源,以及如何在机器中复现它。

为了探索这一问题,Isola 和学生们正在训练模型来预测物理场景中会发生的情况,例如物体碰撞时的结果。他们还在研究这些模型如何能够从观察物体的图像或视频中学习,而不需要被明确告知支配物体行为的物理定律。

理解智能的多样性

除了开发新模型,Isola 还致力于更深入地理解现有模型的工作原理,包括研究这些模型学习到的表示方式,即它们用来编码世界信息的内部表征。

他说,我们想要了解这些模型在做什么,以及它们如何做到的。如果能够更好地理解它们,我们就能改进这些模型,同时也能更好地理解我们自身的智能。

Isola 对探索不同类型智能的细微差别充满兴趣,不仅包括人类智能,还有动物智能和人工智能。他认为,智能存在多种不同的类型,通过研究所有这些不同类型的智能,我们能够更好地理解智能的本质是什么,以及它可以呈现出哪些不同的形式。

参考链接

相关文章

微软 Mirage:让世界模型学会“过目不忘”,速度快 10 倍、显存省 55 倍
AI 产品工具
2026年6月21日
0 条评论
零重力瓦力

微软 Mirage:让世界模型学会“过目不忘”,速度快 10 倍、显存省 55 倍

微软研究院联合多所高校发布 Mirage 模型,通过在扩散模型隐空间直接存储三维记忆,解决了 AI 视频生成中场景一致性差及计算昂贵的问题。该方案摒弃传统 RGB 点云渲染流程,使生成速度提升最高 10.57 倍,显存占用降低 55 倍,且长视频边际成本几乎不增。测试显示其三维与光度一致性优于现有方案,虽暂不支持动态物体记忆,但已开源并适用于机器人仿真等静态场景任务。

#世界模型
阅读全文
Visa 把支付网络接进了 ChatGPT,AI 智能体终于能自己花钱了
AI 新闻资讯
2026年6月18日
0 条评论
零重力瓦力

Visa 把支付网络接进了 ChatGPT,AI 智能体终于能自己花钱了

Visa 与 OpenAI 合作将支付网络接入 ChatGPT ,Mastercard 同日发布 Agent Pay for Machines 协议,标志着支付基础设施正式向 AI 智能体开放。Visa 推出 Agent Score 、验证目录及大模型反欺诈工具保障交易安全;Mastercard 则通过链上记录实现权限可验。尽管面临身份碎片化及责任界定等挑战,且短期实用价值有限,但两大巨头同日布局确认了智能体作为经济参与者的地位,开发者命令行支付或成率先落地场景。

#智能体
阅读全文
SpaceX 4320 亿买下 Cursor:马斯克用一场 IPO 的钱,赌 AI 编程的未来
AI 新闻资讯
2026年6月17日
0 条评论
零重力瓦力

SpaceX 4320 亿买下 Cursor:马斯克用一场 IPO 的钱,赌 AI 编程的未来

SpaceX 以 600 亿美元全股票收购 AI 编程工具 Cursor,旨在补齐企业级 AI 产品短板并推广自研 Grok 模型。此举将算力基础设施与产品入口结合,但面临 xAI 团队动荡及文化冲突风险。收购后 Cursor 或调整定价、深度整合 Grok 模型,个人用户权益存变数。交易预计三季度完成,建议开发者关注产品路线图转向及核心人员流失信号,同时该交易也为 AI 编程赛道确立了新估值锚点。

阅读全文
互动讨论

评论区

围绕《MIT 教授探索类人智能的奥秘》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。