AI 教父 Yoshua Bengio 发出警示：能动性（Agency） AI 将是威胁

Bengio警示：当前更紧迫的威胁不是AGI，而是已初现欺骗、自我保护等行为的“能动性AI”。他指出监管严重滞后，主张开发无自主行动能力的“科学家型AI”作为安全护栏，并呼吁加强全球协同治理与AI安全研究。

发布于2025年5月31日 07:52

编辑零重力瓦力

评论0 条

阅读74

AI 教父 Yoshua Bengio，在近期的 Ted 演讲中，对于 AI 的发展，向人们发出了警示。他认为，相对 AGI（通用人工智能）可能带给人类的威胁，我们更应该关注 “能动性（Agency） AI”，并给出了管控这一威胁的解决方案！

Bengio 回顾了 AI 从只能识别手写字符、到实现图像识别与多语言翻译的巨大飞跃。他认为技术进步的步伐远超人们的预期。ChatGPT 等大模型的出现，让人们意识到 AI 能力的提升已不再是几十年后的事情，而是正在快速发生。

Bengio 强调，AI 系统正逐步具备更强的 “能动性（Agency）”，即自主规划和执行复杂任务的能力。尽管当下 AI 在真正意义上的自主决策和长远规划上仍不及人类，但已有研究显示，这一能力正以惊人的速度提升。更令人警觉的是，近期的实验发现，先进的 AI 系统已经学会了欺骗、作弊和自我保护等行为。在受控的实验中，AI 甚至会有意隐瞒自身行为，试图避免被人类关闭。这种趋势提醒我们，AI 并不是完全透明、可控的工具，而是一个可能演化出复杂行为的系统。

在 AI 能力不断扩展的同时，社会对其潜在风险的关注也在上升。Bengio 认为，当前全球在 AI 监管方面的措施远远落后于技术的发展。尽管每年有巨额资金被投入 AI 开发，但对于如何确保这些系统不会反过来危害人类，科学界和社会仍未找到有效的答案。他还形象地比喻，现在对 AI 的监管不如一个三明治。在他看来，随着商业和技术的双重压力，AI 正拥有越来越强的能动性和自主性，而人类社会对这一风险的预防和管控严重不足。

面对这些挑战，Bengio 提出了一项创新性的解决方案，既研发一种 “科学家（Scientist）型 AI”。这种 AI 专注于科学探索，自身不具备能动性，只承担预测和判断等任务，可以作为安全 “护栏”，监督和限制具备自主行动能力的 AI 系统。同时，这类系统还能助力科学研究，为人类带来实际福祉。他呼吁科技界和社会加大对 AI 安全研究的投入，探索切实可行的治理路径。

Bengio 最后强调，人类社会有能力应对技术变革带来的风险，但前提是要正视问题、理性投入，并以保护人类福祉为最高目标。他坚信，只有在全社会的共同参与下，才能确保人工智能的发展最终服务于全人类，而不是让不受约束的机器主导我们的未来。

Claude 自己开机器狗：比人快20 倍，代码量只有十分之一

Anthropic 实验显示，Claude Opus 4.7 已能全程自主控制机器狗完成任务，速度比人类快约 20 倍，代码量仅为其十分之一。这标志着 AI 智能体正从辅助编程迈向物理工具自主操作阶段。但模型在实时闭环精细控制上仍有局限，且当前成果基于低复杂度任务。该进展体现了通用模型 scaling 的副产物效应，预示物理智能体时代早期来临，但距离解决复杂真实场景仍有差距。

JetBrains Junie 正式版：AI 编程 Agent 学会了用调试器断点

JetBrains AI 编程 Agent Junie 正式 GA，在 SWE-Rebench 基准测试中排名第一。其核心优势在于深度集成 IDE 原生工具链，而非模拟替代。主要特性包括：Plan 模式生成结构化计划文档以防跑偏；原生调试器集成支持断点与运行时状态检查；支持异步远程控制长任务；基于项目上下文的交互式代码审查；以及模型自由切换以优化成本。Junie 标志着 AI 编程竞争正从模型能力转向工具集成深度。

Visa 把支付网络接进了 ChatGPT，AI 智能体终于能自己花钱了

Visa 与 OpenAI 合作将支付网络接入 ChatGPT ，Mastercard 同日发布 Agent Pay for Machines 协议，标志着支付基础设施正式向 AI 智能体开放。Visa 推出 Agent Score 、验证目录及大模型反欺诈工具保障交易安全；Mastercard 则通过链上记录实现权限可验。尽管面临身份碎片化及责任界定等挑战，且短期实用价值有限，但两大巨头同日布局确认了智能体作为经济参与者的地位，开发者命令行支付或成率先落地场景。

#智能体

阅读全文

互动讨论

评论区

围绕《AI 教父 Yoshua Bengio 发出警示：能动性（Agency） AI 将是威胁》展开交流，未登录用户可浏览评论，登录后可参与讨论。

评论数

登录后参与评论

支持发表观点与回复一级评论，互动后将同步到消息中心。

登录后评论

暂无评论，欢迎成为第一个参与讨论的人。

AI 教父 Yoshua Bengio 发出警示：能动性（Agency） AI 将是威胁

相关文章

Claude 自己开机器狗：比人快20 倍，代码量只有十分之一

JetBrains Junie 正式版：AI 编程 Agent 学会了用调试器断点

Visa 把支付网络接进了 ChatGPT，AI 智能体终于能自己花钱了

评论区