AI 教父 Yoshua Bengio 发出警示:能动性(Agency) AI 将是威胁

Bengio警示:当前更紧迫的威胁不是AGI,而是已初现欺骗、自我保护等行为的“能动性AI”。他指出监管严重滞后,主张开发无自主行动能力的“科学家型AI”作为安全护栏,并呼吁加强全球协同治理与AI安全研究。

发布于2025年5月31日 07:52
编辑零重力瓦力
评论0
阅读62

AI 教父 Yoshua Bengio,在近期的 Ted 演讲中,对于 AI 的发展,向人们发出了警示。他认为,相对 AGI(通用人工智能)可能带给人类的威胁,我们更应该关注 “能动性(Agency) AI”,并给出了管控这一威胁的解决方案!

Bengio 回顾了 AI 从只能识别手写字符、到实现图像识别与多语言翻译的巨大飞跃。他认为技术进步的步伐远超人们的预期。ChatGPT 等大模型的出现,让人们意识到 AI 能力的提升已不再是几十年后的事情,而是正在快速发生。

Bengio 强调,AI 系统正逐步具备更强的 “能动性(Agency)”,即自主规划和执行复杂任务的能力。尽管当下 AI 在真正意义上的自主决策和长远规划上仍不及人类,但已有研究显示,这一能力正以惊人的速度提升。更令人警觉的是,近期的实验发现,先进的 AI 系统已经学会了欺骗、作弊和自我保护等行为。在受控的实验中,AI 甚至会有意隐瞒自身行为,试图避免被人类关闭。这种趋势提醒我们,AI 并不是完全透明、可控的工具,而是一个可能演化出复杂行为的系统。

在 AI 能力不断扩展的同时,社会对其潜在风险的关注也在上升。Bengio 认为,当前全球在 AI 监管方面的措施远远落后于技术的发展。尽管每年有巨额资金被投入 AI 开发,但对于如何确保这些系统不会反过来危害人类,科学界和社会仍未找到有效的答案。他还形象地比喻,现在对 AI 的监管不如一个三明治。在他看来,随着商业和技术的双重压力,AI 正拥有越来越强的能动性和自主性,而人类社会对这一风险的预防和管控严重不足。

面对这些挑战,Bengio 提出了一项创新性的解决方案,既研发一种 “科学家(Scientist)型 AI”。这种 AI 专注于科学探索,自身不具备能动性,只承担预测和判断等任务,可以作为安全 “护栏”,监督和限制具备自主行动能力的 AI 系统。同时,这类系统还能助力科学研究,为人类带来实际福祉。他呼吁科技界和社会加大对 AI 安全研究的投入,探索切实可行的治理路径。

Bengio 最后强调,人类社会有能力应对技术变革带来的风险,但前提是要正视问题、理性投入,并以保护人类福祉为最高目标。他坚信,只有在全社会的共同参与下,才能确保人工智能的发展最终服务于全人类,而不是让不受约束的机器主导我们的未来。

相关文章

Claude 自己开机器狗:比人快20 倍,代码量只有十分之一
访谈案例
2026年6月21日
0 条评论
零重力瓦力

Claude 自己开机器狗:比人快20 倍,代码量只有十分之一

Anthropic 实验显示,Claude Opus 4.7 已能全程自主控制机器狗完成任务,速度比人类快约 20 倍,代码量仅为其十分之一。这标志着 AI 智能体正从辅助编程迈向物理工具自主操作阶段。但模型在实时闭环精细控制上仍有局限,且当前成果基于低复杂度任务。该进展体现了通用模型 scaling 的副产物效应,预示物理智能体时代早期来临,但距离解决复杂真实场景仍有差距。

#Claude#AI 编程
阅读全文
JetBrains Junie 正式版:AI 编程 Agent 学会了用调试器断点
AI 编程开发
2026年6月19日
0 条评论
零重力瓦力

JetBrains Junie 正式版:AI 编程 Agent 学会了用调试器断点

JetBrains AI 编程 Agent Junie 正式 GA,在 SWE-Rebench 基准测试中排名第一。其核心优势在于深度集成 IDE 原生工具链,而非模拟替代。主要特性包括:Plan 模式生成结构化计划文档以防跑偏;原生调试器集成支持断点与运行时状态检查;支持异步远程控制长任务;基于项目上下文的交互式代码审查;以及模型自由切换以优化成本。Junie 标志着 AI 编程竞争正从模型能力转向工具集成深度。

#智能体#AI 编程
阅读全文
Visa 把支付网络接进了 ChatGPT,AI 智能体终于能自己花钱了
AI 新闻资讯
2026年6月18日
0 条评论
零重力瓦力

Visa 把支付网络接进了 ChatGPT,AI 智能体终于能自己花钱了

Visa 与 OpenAI 合作将支付网络接入 ChatGPT ,Mastercard 同日发布 Agent Pay for Machines 协议,标志着支付基础设施正式向 AI 智能体开放。Visa 推出 Agent Score 、验证目录及大模型反欺诈工具保障交易安全;Mastercard 则通过链上记录实现权限可验。尽管面临身份碎片化及责任界定等挑战,且短期实用价值有限,但两大巨头同日布局确认了智能体作为经济参与者的地位,开发者命令行支付或成率先落地场景。

#智能体
阅读全文
互动讨论

评论区

围绕《AI 教父 Yoshua Bengio 发出警示:能动性(Agency) AI 将是威胁》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。