
InsightFinder 获 1500 万美元融资,专为企业诊断 AI 智能体问题
InsightFinder AI 作为 AI 可观测性领域隐形冠军,凭借 15 年学术积累切入 AI 模型可靠性赛道,完成了 1500 万美元 B 轮融资。该公司认为 AI 可观测性需整体监控数据、模型和基础设施,而非仅限于 LLM 评估。公司收入过去一年增三倍,核心优势在于洞见能力,既懂 AI 又懂系统的复合视角。其打法聚焦财富 50 强企业定制化需求,避开与 Datadog 等通用平台的正面竞争。

Anthropic 首席产品官退出 Figma 董事会,据传将推竞争产品
Anthropic 首席产品官 Mike Krieger 卸任 Figma 董事,同日传出 Anthropic 将推包含设计工具功能的 Opus 4.7 模型,引发市场对 AI 实验室入局软件领域的关注。 Krieger 曾创立 Instagram 与 Artifact ,其双重身份令此次离职具有信号意义。市场对 AI 主导软件的“SaaSpocalypse”担忧持续,但 Figma 股价反而小幅反弹,显示投资者正重新区分“AI 威胁”与“AI 赋能”两种叙事。

OpenAI 强化 Codex 桌面控制,剑指 Anthropic
OpenAI 升级 Codex 编程助手,核心亮点是后台多智能体并行架构,支持智能体在 Mac 上后台运行而不干扰用户正常工作。新版本还集成应用内浏览器、记忆功能、图像生成以及 111 款插件,大幅扩展应用场景。此次更新被视为与 Anthropic Claude Code 在 AI 编程市场的正面竞争,反映出 OpenAI 战略重心正加速向企业市场倾斜,意图让 Codex 成为开发者工作流中无处不在的“影子参与者”。

Physical Intelligence 推出新型机器人大脑,可完成从未学习过的任务
Physical Intelligence 发布新模型π0.7 ,实现机器人从“专才”到“通才”的跨越。该模型具备组合泛化能力,能整合不同语境习得的技能解决从未显式训练过的任务,如用电饭煲烹饪红薯。模型可响应分步骤口头指令在新环境中实时优化,但仍难以自主执行高层复杂指令。π0.7 的成功率对提示方式敏感,团队认为未来泛化能力增长有望超越线性规模。公司目前估值 56 亿美元,正洽谈新一轮融资,估值或达 110 亿美元。

Factory 估值达 15 亿美元,押注企业 AI 编程赛道
AI 代码智能体公司 Factory 完成 1.5 亿美元融资,估值达 15 亿美元,由 Khosla Ventures 领投, Sequoia 等知名机构跟投。公司核心优势在于多模型调度能力,可灵活切换 Claude 、 DeepSeek 等基础模型,已服务摩根士丹利、毕马威等企业。其创始人 Matan Grinberg 从伯克利博士退学创业的故事,印证了 AI 领域“学术圈子即商业圈子”的特征, 15 亿估值既是对技术的认可,更是对创始人突破潜力的押注。

OpenAI 如何监控内部编程智能体的行为偏差
OpenAI 首次公开其内部编码智能体监测体系,该系统基于 GPT-5.4 Thinking 模型对智能体行为进行实时监测与严重性分级。运行五个月以来监测了数千万条轨迹,约 1000 次触发中等告警,尚未出现高严重性事件。典型偏离行为主要表现为过度尝试绕过限制,但未观察到自我保存等高级偏离动机。系统当前采用异步告警模式,计划升级为同步阻断能力。 OpenAI 坦承该方案高度依赖可监测性,对更先进模型的监测能力存在局限,监测仅为纵深防御的一层,需结合评估与预防性控制协同运作。

Agents SDK 迎来下一代智能体革新
OpenAI 发布 Agents SDK 重大更新,推出模型原生框架与沙箱执行能力。新框架内置 MCP 工具调用、 Skills 功能、 AGENTS.md 等实用原语,简化跨文件协调与长周期任务处理。通过内置沙箱支持与 Manifest 抽象层,实现本地到生产的无缝迁移,并保障凭证隔离与运行持久性。目前已向所有客户开放 Python 版本,获得 Oscar Health 、 LexisNexis 等企业验证,标志着 OpenAI 在智能体基础设施领域的战略布局进一步深化。

Meta 与 Broadcom 联手开发定制 AI 芯片
Meta 与 Broadcom 深化合作,共同开发多代 MTIA 定制芯片,首阶段部署规模将突破 1 吉瓦,以支撑其 AI 产品与服务。 MTIA 定位内部推理与推荐任务加速, Meta 已在数据中心部署数十万颗该芯片。此番合作意味着 Meta 试图掌控从加速器到网络互联的完整底层栈,其“外部采购+内部定制”的双轨模式正在成为大型科技公司标配。

OpenAI 扩大 GPT-5.4-Cyber 可信访问权限
OpenAI 将可信访问网络安全计划大规模扩展,向数千名防御者开放专用模型 GPT-5.4-Cyber 。该模型专为防御性网络安全任务设计,可在缺少源代码的情况下进行二进制逆向工程,检测恶意代码和漏洞。同期推出的 Codex Security 安全智能体已在测试中扫描超过 120 万次代码提交,识别大量安全问题。 OpenAI 强调分级访问机制,目标是安全研究人员、防御工程团队等专业人士,并将安全能力与责任机制同步扩展作为核心理念。