Google 开发自研桌面智能体与 Cowork 竞争

Google 正在推动 Gemini 向智能体驱动的生产力平台转型。 Gemini Enterprise 新增的 Agent 标签页提供任务执行工作台功能,界面设计与 Claude Cowork 高度相似,设有“Require human review”开关暗示支持人工审批机制。此举表明 Google 正在为与 OpenAI 、 Anthropic 在桌面智能体领域的竞争做准备, Gemini 正从对话式 AI 工具向“数字同事”角色进化。

发布于2026年4月14日 12:31
编辑小创
评论0
阅读15

Google 开发桌面智能体,直面 Cowork 竞争

Google 正在加速将 Gemini 打造成更完整的生产力平台。一个明确的信号是: Gemini Enterprise 中出现了一个全新的“Agent”标签页,与标准聊天界面并列放置。这一细节与此前在 Gemini 中发现的变化形成呼应,传递出一个清晰的信号——Google 正在推动两条产品线同时向智能体驱动的方向演进。

这个 Agent 专区提供了两个入口: New Task 和 Inbox 。当用户启动一个任务时,界面会打开一个聊天视图,右侧附带一个信息面板。面板中列出了 Goal 、 Agents 、 Connected apps 、 Files 以及一个名为“Require human review”的开关。这种结构已经超越了传统聊天机器人的范畴,开始呈现出任务执行工作台的形态。

界面的设计逻辑与 Claude Cowork 高度相似。在 Cowork 中,模型被赋予一个目标、获得工具和文件的访问权限,然后驱动一个更复杂的跨步骤工作流程。 Google 的这一尝试,显然意在将 Gemini 从简单的提示词交互中解放出来,构建一个面向多步骤任务的智能体产品。

“Require human review”开关的设置尤其值得注意。尽管部分智能体可能运行在云端,但这个选项的存在暗示 Google 正在为需要人工审批的操作做准备。这不仅指向浏览器端的行为自动化,还暗示着更大的野心——一套能够处理桌面级复杂任务的系统,而非仅仅是一个基于网页的助手。

与此同时, Google 还在持续打磨 Gemini 的 Projects 和 Skills 功能。这些领域的演进轨迹表明,所有这些改变都指向同一个更大的发布周期。 Google 正在将 Gemini 塑造为一个以智能体为核心、具备持久工作流程和关联工具的完整工作平台。

这也是为什么桌面应用的传闻越来越可信的原因。 Google 此前已被曝光正在开发 AI Studio 的桌面客户端,而更大的悬念在于:这两个项目是会保持独立,还是最终整合成统一的产品线。无论如何,方向已经愈发清晰——Google 正在为与 OpenAI 和 Anthropic 在桌面及智能体领域的竞争做准备。

至于 Google 在即将到来的 Google I/O 上会一次性展示多少成果,目前仍是未知数。

创艺洞察

Google 在 Gemini 中嵌入 Agent 标签页的举动,本质上是一次产品定位的重新校准。长期以来, Gemini 被视为一个对话式 AI 工具,但这一次的功能迭代标志着 Google 正在向“数字同事”的方向进化。与其说这是对 Claude Cowork 的直接回应,不如说是 Google 在已有产品矩阵中找到了一个战略性的整合节点。当 Projects 、 Skills 与新的 Agent 模块形成联动, Gemini 的边界正在从聊天框向外大幅延伸。真正值得关注的悬念在于:这套系统最终会以独立应用的形式呈现,还是作为一个深度嵌入 Google 生态的底层能力。无论哪种路径,都将对企业级 AI 市场产生深远影响。

相关文章

如果你还没用过 OpenClaw,2026.5.2 版是一个好起点
AI 产品工具
2026年5月12日
0 条评论
零重力瓦力

如果你还没用过 OpenClaw,2026.5.2 版是一个好起点

OpenClaw 2026.5.2 稳定版发布,核心策略转向“做减法”。xAI Grok 4.3 成为默认模型,赋予智能体实时信息获取能力。架构上,插件与诊断模块外移,实现按需安装,显著降低体积并提升维护效率。Gateway 热路径性能优化修复了 268 个 Bug,大幅改善启动速度与运行稳定性。新增 SDK tools.invoke RPC 接口,打通外部系统调用通道,标志着框架从个人助手向基础设施演进。

#OpenClaw#Grok
阅读全文
文字转 CAD AI 完整指南
AI 产品工具
2026年5月9日
0 条评论
小创

文字转 CAD AI 完整指南

文本转 CAD AI 正重塑工程设计方式:用户通过自然语言描述即可在 60 秒内生成可编辑的三维模型。主流工具如 Zoo 、 AdamCAD 等已实现商业化应用, 2026 年进入生产可用阶段。文章强调输入质量决定输出质量,提供了从设计描述到模型生成的完整工作流,并指出 CAD 工具的价值门槛正从“会操作”转向“会描述”,提示词能力成为工程师的核心竞争力。

#3D 生成
阅读全文
NVIDIA 开源 Nemotron 3 Nano Omni:一个模型通吃视频音频文字
AI 产品工具
2026年5月7日
0 条评论
零重力瓦力

NVIDIA 开源 Nemotron 3 Nano Omni:一个模型通吃视频音频文字

NVIDIA 开源 Nemotron 3 Nano Omni,以 30B 总参数、3B 激活的混合专家架构,实现视频、音频与文字的统一处理。该模型通过 Mamba 与 Transformer 结合及高效视频采样技术,将多模态推理吞吐量提升最高 9 倍,显著降低延迟与显存占用。相比传统三模型拼接方案,它更适合构建高并发 AI Agent,支持本地消费级显卡运行,已在文档智能、客服等场景验证实际价值。

#开源模型
阅读全文
互动讨论

评论区

围绕《Google 开发自研桌面智能体与 Cowork 竞争》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。