继 Anthropic 的 Mythos 之后, OpenAI 推出新型网络安全模型与战略

OpenAI 发布专用网络安全模型 GPT-5.4-Cyber ,采用克制态度强调现有安全防护已足够。该公司提出三大战略支柱:客户验证系统、迭代部署和投资布局。同时 Anthropic 持不同观点,认为更先进 AI 模型存在被恶意利用风险,引发安全专家争议。

发布于2026年4月15日 13:30
编辑小创
评论0
阅读35

OpenAI 发布专用网络安全模型 强调现有防护措施已足够

OpenAI 于本周二公布了其网络安全战略的下一阶段规划,并同步推出了一款专为数字防御者设计的全新模型 GPT-5.4-Cyber 。

这一消息发布恰逢竞争对手 Anthropic 上周宣布将其 Claude Mythos Preview 模型暂不公开。据 Anthropic 方面表示,该模型存在被黑客和不法分子利用的风险。与此同时, Anthropic 还牵头成立了一个涵盖 Google 等行业竞争者的产业联盟,旨在探讨生成式 AI 领域的进展将对网络安全产生何种影响。

面对 Anthropic 的高调预警, OpenAI 显然有意在周二传递出截然不同的信息基调。这家 AI 巨头采用了更为克制的语气,一边强调其现有的安全护栏和防御机制,一边暗示长期来看的确需要更先进的防护手段。

OpenAI 在当天发布的博客文章中写道:“我们认为,当前所使用的安全防护级别已足以显著降低网络风险,支持现有模型的大规模部署。我们预计,这些防护措施的基本框架将同样适用于即将推出的更强能力模型。不过,对于那些专门针对网络安全工作进行训练并被设置为更高开放程度的模型,则需要更严格的部署控制和相应的管理机制。从长远来看,为确保 AI 安全在网络安全领域的持续有效性,我们还预见到未来模型需要更加全面的防御手段——届时这些模型的能力将快速超越当前最好的专用模型。”

围绕网络安全战略, OpenAI 将重心锁定在三大支柱上。第一支柱涉及所谓的“了解你的客户”验证系统,旨在实现对新型模型的可控访问,同时尽可能扩大其“民主化”覆盖范围。 OpenAI 在博客中表示:“我们设计的机制旨在避免武断地决定谁能获得访问权限用于合法目的,谁不能。”该公司将针对特定组织进行有限发布与今年 2 月推出的自动化系统 Trusted Access for Cyber (简称 TAC )相结合。

第二支柱是“迭代部署”,即通过审慎的方式逐步释放新能力,让公司获得真实世界的反馈与洞察。博客特别强调了“对越狱攻击和其他对抗性攻击的抵御能力”以及“提升防御能力”两个重点方向。第三支柱则是投资布局,该公司表示这些投资将支持软件安全及其他数字防御领域,随着生成式 AI 的普及而持续发挥作用。

OpenAI 表示,这一系列举措是其更广泛安全努力的一部分。上个月启动的应用安全 AI 智能体 Codex Security 、 2023 年启动的网络安全资助计划、向 Linux Foundation 捐款支持开源安全项目,以及用于评估和防御前沿 AI 能力“严重伤害”的“准备框架”,均被纳入这一整体框架。

Anthropic 上周关于更强 AI 模型必将引发网络安全清算的主张,在安全专家群体中引发了争议。部分声音认为这一担忧言过其实,可能助长新一轮反黑客情绪,进一步巩固科技巨头的权力。另一些专家则强调,当前安全防御中已知的漏洞和不足确实存在,在智能体 AI 时代完全可能被更广泛的恶意行为者以全新速度和强度加以利用。

相关文章

Visa 把支付网络接进了 ChatGPT,AI 智能体终于能自己花钱了
AI 新闻资讯
2026年6月18日
0 条评论
零重力瓦力

Visa 把支付网络接进了 ChatGPT,AI 智能体终于能自己花钱了

Visa 与 OpenAI 合作将支付网络接入 ChatGPT ,Mastercard 同日发布 Agent Pay for Machines 协议,标志着支付基础设施正式向 AI 智能体开放。Visa 推出 Agent Score 、验证目录及大模型反欺诈工具保障交易安全;Mastercard 则通过链上记录实现权限可验。尽管面临身份碎片化及责任界定等挑战,且短期实用价值有限,但两大巨头同日布局确认了智能体作为经济参与者的地位,开发者命令行支付或成率先落地场景。

#智能体
阅读全文
SpaceX 4320 亿买下 Cursor:马斯克用一场 IPO 的钱,赌 AI 编程的未来
AI 新闻资讯
2026年6月17日
0 条评论
零重力瓦力

SpaceX 4320 亿买下 Cursor:马斯克用一场 IPO 的钱,赌 AI 编程的未来

SpaceX 以 600 亿美元全股票收购 AI 编程工具 Cursor,旨在补齐企业级 AI 产品短板并推广自研 Grok 模型。此举将算力基础设施与产品入口结合,但面临 xAI 团队动荡及文化冲突风险。收购后 Cursor 或调整定价、深度整合 Grok 模型,个人用户权益存变数。交易预计三季度完成,建议开发者关注产品路线图转向及核心人员流失信号,同时该交易也为 AI 编程赛道确立了新估值锚点。

阅读全文
电影大师斯科塞斯开始用 AI 画分镜了
AI 新闻资讯
2026年6月4日
0 条评论
零重力瓦力

电影大师斯科塞斯开始用 AI 画分镜了

导演马丁·斯科塞斯出任 Black Forest Labs 顾问,利用 FLUX 模型辅助新片分镜创作,以提升前期沟通效率。此举标志着好莱坞对 AI 工具的接纳度提升,但也引发关于视觉同质化与艺术独特性的争议。BFL 借此验证“视觉智能”在分镜等中间环节的商业价值,而非替代最终创作。斯科塞斯将 AI 定位为表达工具而非想象替代者,其应用仍局限于筹备阶段,影视行业对 AI 的深度整合尚待观察。

#AI 绘画
阅读全文
互动讨论

评论区

围绕《继 Anthropic 的 Mythos 之后, OpenAI 推出新型网络安全模型与战略》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。