
Google 开发自研桌面智能体与 Cowork 竞争
Google 正在推动 Gemini 向智能体驱动的生产力平台转型。 Gemini Enterprise 新增的 Agent 标签页提供任务执行工作台功能,界面设计与 Claude Cowork 高度相似,设有“Require human review”开关暗示支持人工审批机制。此举表明 Google 正在为与 OpenAI 、 Anthropic 在桌面智能体领域的竞争做准备, Gemini 正从对话式 AI 工具向“数字同事”角色进化。

OpenAI 测试 Codex 超级应用的网页浏览功能
OpenAI 正对 Codex 进行重大升级,将其定位为超级应用战略核心产品。新版本引入用户分层配置、 PR 管理、 UI 预览与内联评论等功能,并支持并行任务处理, Codex 正从编程工具演变为覆盖规划、构建、审查、发布的全周期开发环境。此举旨在与 Anthropic 的 Claude Code 等竞品竞争,最终目标是让 ChatGPT 与 Atlas 浏览器在桌面端合二为一,成为统一超级应用。

微软正在开发另一个 OpenClaw 类智能体
微软正测试将开源本地智能体 OpenClaw 的核心功能整合至 Microsoft 365 Copilot 平台,面向企业客户强化安全控制。新产品定位为“持续运行”版 Copilot ,能随时执行跨长时间周期的多步骤任务,计划于 6 月 Microsoft Build 大会亮相。此举标志着微软智能体产品线从云端向本地延伸,与已发布的 Copilot Cowork 、 Copilot Tasks 形成互补。分析认为,本地化运行不仅关乎安全,更意味着更低延迟和更强离线能力,但如何在隐私风险与用户体验间取得平衡将是关键挑战。

传苹果正测试四款智能眼镜设计
Apple 正在测试四款智能眼镜原型,计划最快 2027 年面市。与此前 Vision Pro 的混合现实路线不同,这款眼镜不配备显示屏,定位更接近 Meta 与雷朋合作产品,主打拍照、录像、通话、音乐播放及 Siri 智能交互等功能。此举被视为 Apple 在无显示屏智能眼镜赛道上的精准卡位,避开尚不成熟的显示技术,转而聚焦音频、语音和影像等基础交互能力,试图在智能眼镜成为下一代交互载体的趋势中抢占先机。

Nano Banana 2 :融合 Pro 级性能,闪电般极速
Google DeepMind 发布 Nano Banana 2 图像生成模型,将专业级能力与极速响应合二为一。核心升级包括继承 Pro 版的世界知识与文本渲染技术,同时具备闪电般的生成速度。技术亮点涵盖精准对象渲染、信息图表与数据可视化、主体一致性支持 5 角色 14 对象、复杂指令理解及 512 像素至 4K 分辨率输出。该模型现已集成至 Gemini 、 Google 搜索等多平台,并强化 SynthID 溯源技术。这标志着生成式 AI 图像领域专业工具的加速普惠。

Bret Taylor 放言:按钮点击时代已终结
Sierra CEO Bret Taylor 预测,自然语言交互将取代传统软件界面。其 Ghostwriter 产品可根据用户描述自动创建智能体,为 Nordstrom 四周完成部署,公司成立不到 21 个月 ARR 即达 1 亿美元,估值达 100 亿美元。但技术专家指出,当前智能体部署远未实现完全自动化,仍依赖“前置部署工程师”团队持续调整优化,揭示了 AI 落地中“自动化”产品背后人工依赖密集的核心悖论。

Poke 让 AI 智能体使用像发短信般简单
总部位于帕洛阿尔托的初创公司推出智能体产品 Poke ,用户通过 iMessage 、短信或 Telegram 即可指挥 AI 处理日常事务,无需下载应用。该公司已完成 1000 万美元融资,估值达 3 亿美元,采用动态模型调度技术,基础功能免费。 Poke 旨在实现零门槛 AI 触达,让智能体成为大众日用品。

Tubi 成为首个在 ChatGPT 推出原生应用的流媒体平台
Tubi 率先将深度定制体验接入 ChatGPT 对话界面,用户可通过自然语言描述获取个性化影视推荐。此举反映流媒体平台在海量内容中争夺用户注意力的竞争压力,也标志着 Tubi 从自建 AI 能力转向融入用户已习惯的 AI 入口生态。依托 ChatGPT 近 9 亿周活用户与 Tubi 超 1 亿月活用户基础,这一深度绑定或将重塑内容分发逻辑。同时, Tubi 推出创作者孵化计划,开放平台资源扶持原创内容新人。

Astropad Workbench 重新定义远程桌面:专为 AI 智能体打造
Mac mini 正成为 AI 智能体运行的首选平台。针对远程监控需求, Astropad 推出专为 AI 时代设计的 Workbench 远程桌面方案,支持高保真画面传输、语音指令及多设备切换。该产品源于团队自身使用痛点,填补了现有远程桌面在 AI 智能体监控场景的空白,提供 iPhone/iPad 客户端,实现随时随地查看日志、重启任务等操作。