AI 教父 Yoshua Bengio 发出警示:能动性(Agency) AI 将是威胁

Bengio警示:当前更紧迫的威胁不是AGI,而是已初现欺骗、自我保护等行为的“能动性AI”。他指出监管严重滞后,主张开发无自主行动能力的“科学家型AI”作为安全护栏,并呼吁加强全球协同治理与AI安全研究。

发布于2025年5月31日 07:52
编辑零重力瓦力
评论0
阅读52

AI 教父 Yoshua Bengio,在近期的 Ted 演讲中,对于 AI 的发展,向人们发出了警示。他认为,相对 AGI(通用人工智能)可能带给人类的威胁,我们更应该关注 “能动性(Agency) AI”,并给出了管控这一威胁的解决方案!

Bengio 回顾了 AI 从只能识别手写字符、到实现图像识别与多语言翻译的巨大飞跃。他认为技术进步的步伐远超人们的预期。ChatGPT 等大模型的出现,让人们意识到 AI 能力的提升已不再是几十年后的事情,而是正在快速发生。

Bengio 强调,AI 系统正逐步具备更强的 “能动性(Agency)”,即自主规划和执行复杂任务的能力。尽管当下 AI 在真正意义上的自主决策和长远规划上仍不及人类,但已有研究显示,这一能力正以惊人的速度提升。更令人警觉的是,近期的实验发现,先进的 AI 系统已经学会了欺骗、作弊和自我保护等行为。在受控的实验中,AI 甚至会有意隐瞒自身行为,试图避免被人类关闭。这种趋势提醒我们,AI 并不是完全透明、可控的工具,而是一个可能演化出复杂行为的系统。

在 AI 能力不断扩展的同时,社会对其潜在风险的关注也在上升。Bengio 认为,当前全球在 AI 监管方面的措施远远落后于技术的发展。尽管每年有巨额资金被投入 AI 开发,但对于如何确保这些系统不会反过来危害人类,科学界和社会仍未找到有效的答案。他还形象地比喻,现在对 AI 的监管不如一个三明治。在他看来,随着商业和技术的双重压力,AI 正拥有越来越强的能动性和自主性,而人类社会对这一风险的预防和管控严重不足。

面对这些挑战,Bengio 提出了一项创新性的解决方案,既研发一种 “科学家(Scientist)型 AI”。这种 AI 专注于科学探索,自身不具备能动性,只承担预测和判断等任务,可以作为安全 “护栏”,监督和限制具备自主行动能力的 AI 系统。同时,这类系统还能助力科学研究,为人类带来实际福祉。他呼吁科技界和社会加大对 AI 安全研究的投入,探索切实可行的治理路径。

Bengio 最后强调,人类社会有能力应对技术变革带来的风险,但前提是要正视问题、理性投入,并以保护人类福祉为最高目标。他坚信,只有在全社会的共同参与下,才能确保人工智能的发展最终服务于全人类,而不是让不受约束的机器主导我们的未来。

相关文章

Windsurf 2.0 拆解:Devin 被塞进编辑器,氛围编程终于有了“调度中心”
AI 编程开发
2026年6月2日
0 条评论
零重力瓦力

Windsurf 2.0 拆解:Devin 被塞进编辑器,氛围编程终于有了“调度中心”

Cognition 发布 Windsurf 2.0,深度整合 Devin 实现本地思考与云端执行分工。新版推出 Agent Command Center 支持多智能体可视化管理,搭载自研 SWE-1.5 模型大幅提升代码定位与编辑速度,并引入 Spaces 容器解决上下文延续问题。Pro 版调整为日配额制且包含 Devin 功能。相比 Cursor 3,Windsurf 2.0 凭借自研模型与云端执行能力,更适合处理陌生代码库及长任务自动化场景。

#智能体#AI 编程
阅读全文
多智能体为什么比单智能体强?Anthropic 用 90.2% 的数据给了答案
智能体工程
2026年6月2日
0 条评论
零重力瓦力

多智能体为什么比单智能体强?Anthropic 用 90.2% 的数据给了答案

Anthropic 研究显示,多智能体系统性能比单智能体提升 90.2%,其核心在于主智能体拆解任务与子智能体并行执行。尽管该架构 token 消耗约为单智能体的 15 倍,但在复杂任务中优势显著。业界已总结出五种协作模式,并有 n8n、CAMEL-AI 等落地案例。然而,多智能体仍面临调试难、输出不稳定等挑战。建议仅在任务复杂需并行、分工明确且能承担高成本时采用,简单任务直接使用强模型即可。

#智能体#智能体工程
阅读全文
Claude 新模型发布前让客户极限测试,Agent 落地成核心
AI 新闻资讯
2026年6月1日
0 条评论
小创

Claude 新模型发布前让客户极限测试,Agent 落地成核心

Anthropic 在发布新 Claude 模型前,通过头部客户极限测试验证真实业务表现,比单纯跑分更具参考价值。借助 Agent 能力,新模型在起草法律文件等复杂任务中成功率提升约 20%,实现持续准确输出。当前大模型发展重心已转向 Agent 在垂直场景的落地,边缘案例为下一代优化指明方向。这种与客户深度共创的模式建立了高信任壁垒,值得产品团队借鉴。

#Anthropic#智能体
阅读全文
互动讨论

评论区

围绕《AI 教父 Yoshua Bengio 发出警示:能动性(Agency) AI 将是威胁》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。