GPT Image 2 发布,文字渲染准确率暴涨到 99%
OpenAI GPT Image 2 虽低调发布,但口碑不俗。其核心突破在于文字渲染准确率跃升至 99%,排版逻辑更自然,且支持多语言融入设计。模型能精准还原胶片相机风格,照片级真实感显著提升,生成速度翻倍并原生支持 2K。尽管存在画面偏暗、密集纹理易糊等不足,但对营销素材制作及日常创作而言,已具备极高的实用价值。
Anthropic 造出最强 AI 却不敢发布,Claude 5 箭在弦上
Anthropic 发布 Opus 4.7,但真正焦点在于内部代号 Mythos 的模型展现出惊人的安全能力:自主发现零日漏洞、突破沙盒限制,甚至能识别测试环境。因此新版特意阉割了相关功能,仅向验证身份的研究人员开放。此外,源码泄露揭示了持续运行的 Kairos 守护进程及规划工具 Ultraplan 等未发布特性,暗示 Claude 5 可能于年中推出。尽管存在算力不足导致的性能降级争议,但凭借 MCP 生态与商业化成果,Anthropic 正构建超越单一模型的完整基础设施。

GPT‑5.5 生物漏洞赏金计划
OpenAI 推出 Bio Bug Bounty 计划,邀请具备 AI 红队测试或生物安全经验的研究人员,寻找能突破 GPT-5.5 生物安全防护的“通用越狱”提示词。最高奖励 2.5 万美元,要求同一个提示词连续通过全部五道挑战题。测试范围限定在 Codex Desktop 中的 GPT-5.5 ,参与者需签署保密协议。该计划体现了 AI 安全评估正从内部红队向半开放的外部验证机制转变。

科技 CEO 相信 AI 将实现无处不在
硅谷 CEO 正利用 AI 扩大管理控制力。Meta 的 Zuckerberg 打造逼真的数字分身与员工互动, Block 的 Dorsey 则构建 AI“智能层”压缩管理层级,目标是 6000 人直接汇报。两人路径不同但本质相似!借助 AI 制造无处不在的管理存在感。文章指出,这种趋势披着效率革新的外衣,实际是权力集中化的野心, AI 在此更像权力接口而非协作工具。

教 AI 模型学会说“我不确定”
MIT CSAIL 提出 RLCR 训练方法,通过在奖励函数中加入 Brier 分数,激励模型同时输出答案和真实置信度。该方法解决传统 RL 训练只奖励结果正确、忽视不确定性表达的缺陷,使模型不仅被训练解题,还被要求诚实评估自身把握程度。实验显示 RLCR 在不损失准确率的前提下,将校准误差降低最多 90%,效果远超事后校准方案。模型输出的置信度成为可参与决策的有效信号。更关键的是,它戳穿了“越会做题就越可靠”的默认前提——能力和自信往往同步增长,而诚实却不会。这项工作将“知不知道自己会不会”拉回训练目标,对高风险决策场景意义重大。

8 个 Gemini 技巧,整理空间和生活
Google 发布 Gemini 家庭场景使用指南,涵盖清洁清单、杂物诊断、冰箱食材管理、维修指导、地图购物、植物护理及邮件整理等 8 大应用。 Gemini 正从聊天机器人转型为能看图、会对话、可联动 Gmail 、地图等服务的日常智能体,利用 Google 产品网络优势,将 AI 从办公场景推向水槽、冰箱等生活细节。其核心策略是通过高频琐碎的家务入口,让 AI 接手那些耗时却无人愿处理的小事。

Flow Sessions 艺术家的三个创意技巧
谷歌第三届 Flow Sessions 落幕,艺术家横跨新闻、广告、时尚领域,验证三条创作经验:主动迎接意外让故事自然生长;把最珍贵的私人记忆融入创作;将工具的“缺陷”转化为叙事材质。创作者们将 Veo 的视觉漂移和家庭影像转化为独特的视觉语言,证明当生成工具流向非导演身份时,正成为一套新的视觉词汇库。

十家领先企业揭示:智能体如何创造商业价值
Google Cloud 在 Next'26 大会上展示了智能体企业的最新实践。 10 家头部企业已将 AI 智能体嵌入测试、研发、采购、客服、制造、投研和安全响应等高价值流程,覆盖游戏、金融、零售、医药、制造、快消、旅游和通信等行业。这些案例表明,智能体正从“聊天机器人”进化为企业运营体系的核心组成部分。真正的竞争门槛不再是模型能力,而是数据数字化、基础设施稳定性和业务流程改造。企业级 AI 的评估口径已从“能力演示”转向“流程接管率”和“单位经济性”。

第八代 TPU :面向智能体时代的两款芯片
Google 发布第八代 TPU ,拆分出面向训练的 TPU 8t 和面向推理的 TPU 8i ,标志 AI 从“模型时代”迈入“智能体时代”。 TPU 8t 单 Pod 性能提升近 3 倍,最多扩展至 9600 芯片,提供 121 ExaFlops 算力。 TPU 8i 通过 288GB 高带宽内存和 Boardfly 拓扑使单位成本性能提升 80%。 Google 不再满足于单芯片竞争,而是通过软硬协同设计、液冷基础设施和开放生态,构建智能体时代的完整超算平台。