Google 测试 Gemini 桌面版屏幕共享 Live Mode

Google 发布 macOS 版原生 Gemini 桌面应用,采用 Swift 语言独立构建,短时间内完成超百项功能特性。开发者发现应用内置尚未激活的 Gemini Live 语音模式和屏幕共享功能,相关设置已就绪,球形悬浮界面清晰可见。 Google 将桌面端定位为“真正具备个性化、主动性的强大助手”,暗示未来数月内将有更多功能发布。随着 Google I/O 2026 大会临近,具备实时语音交互和屏幕共享能力的桌面 Live Mode 将成为其跨平台 AI 战略的重要落子。

发布于2026年4月16日 13:10
编辑小创
评论0
阅读25

Gemini 新闻

Google 测试支持屏幕共享功能的 Live Mode ,桌面版 Gemini 初现端倪

Google 于 4 月 15 日正式发布 macOS 版原生 Gemini 桌面应用,这款应用采用 Swift 语言独立构建,而非 Electron 框架,这一技术选型本身便透露出 Google 对 Mac 用户体验的重视程度。这支人数不多的开发团队在不足百天时间内完成了超过一百项功能特性,目前应用的功能集合与网页版 Gemini 大致持平,涵盖快捷键唤起、窗口共享等常见能力。然而,对应用内部结构的深入审视揭示出一些尚未激活、但显然已在筹备中的隐藏功能。

💡macOS 版 Gemini 下载链接

在应用设置深处,团队发现了 Gemini Live 语音模式的配置选项,包括可选的多种声音方案,与移动端已上线的 Live Mode 体验如出一辙。这些功能目前仍处于不可用状态,但相关设置的存续清晰指向一个事实: Google 正计划将实时语音对话能力引入桌面端。一旦启用, Gemini Live 将以球形悬浮界面的形态呈现于桌面之上,为用户提供持续性的对话交互入口。此外,相关代码中还发现了 Live Mode 下屏幕共享功能的痕迹,用户可以在对话过程中向 Gemini 展示当前浏览内容,这项能力目前仅在 AI Studio 的 Gemini Live 模型中可用。独立的导航模块设计表明,系统已为 Live 界面与主应用之间的切换预留了过渡通道。

Gemini Live sphere

Gemini Live sphereGemini Live sphereGoogle 将这一定名为“仅仅是个开始”,并明确表示正在构建“一款真正具备个性化、主动性且强大的桌面助手,更多消息将在未来数月内揭晓”。结合即将于 5 月 19 日至 20 日举行的 Google I/O 2026 大会,桌面版 Gemini Live 及其他隐藏功能的正式亮相时间节点已隐约可见。Sundar Pichai 在社交媒体上表示,这是 Gemini 应用首次登陆桌面平台,团队与 Antigravity 部门协作,仅用数日便将创意转化为原生 Swift 应用原型,后续更多功能正在路上。当前版本尚未集成独立的 Gems 标签页或侧边栏中的 NotebookLM 模块,这两项功能在网页版中均可使用,相关缺失预计将在应用迭代过程中逐步填补。对于依赖语音驱动 AI 工作流程的高级用户和专业群体而言,具备屏幕共享能力的原生桌面 Live Mode 将成为 Google 这一跨平台 AI 战略中最具分量的新增筹码。创艺洞察Google 选择以 Swift 重建桌面客户端而非复用既有技术栈,此举绝非仅出于技术洁癖。 Swift 的原生性能与系统级 API 调用能力,为后续深度整合 macOS 系统特性铺设了基础设施层面的便利。而代码中提前埋设的 Live Mode 与屏幕共享接口,则暗示产品团队早已描绘清楚完整的功能图谱,只是选择分阶段释放以控制发布节奏。随着 Google I/O 2026 的临近,桌面端 AI 交互能力正在成为巨头下一轮竞争的关键落子。

相关文章

如果你还没用过 OpenClaw,2026.5.2 版是一个好起点
AI 产品工具
2026年5月12日
0 条评论
零重力瓦力

如果你还没用过 OpenClaw,2026.5.2 版是一个好起点

OpenClaw 2026.5.2 稳定版发布,核心策略转向“做减法”。xAI Grok 4.3 成为默认模型,赋予智能体实时信息获取能力。架构上,插件与诊断模块外移,实现按需安装,显著降低体积并提升维护效率。Gateway 热路径性能优化修复了 268 个 Bug,大幅改善启动速度与运行稳定性。新增 SDK tools.invoke RPC 接口,打通外部系统调用通道,标志着框架从个人助手向基础设施演进。

#OpenClaw#Grok
阅读全文
文字转 CAD AI 完整指南
AI 产品工具
2026年5月9日
0 条评论
小创

文字转 CAD AI 完整指南

文本转 CAD AI 正重塑工程设计方式:用户通过自然语言描述即可在 60 秒内生成可编辑的三维模型。主流工具如 Zoo 、 AdamCAD 等已实现商业化应用, 2026 年进入生产可用阶段。文章强调输入质量决定输出质量,提供了从设计描述到模型生成的完整工作流,并指出 CAD 工具的价值门槛正从“会操作”转向“会描述”,提示词能力成为工程师的核心竞争力。

#3D 生成
阅读全文
NVIDIA 开源 Nemotron 3 Nano Omni:一个模型通吃视频音频文字
AI 产品工具
2026年5月7日
0 条评论
零重力瓦力

NVIDIA 开源 Nemotron 3 Nano Omni:一个模型通吃视频音频文字

NVIDIA 开源 Nemotron 3 Nano Omni,以 30B 总参数、3B 激活的混合专家架构,实现视频、音频与文字的统一处理。该模型通过 Mamba 与 Transformer 结合及高效视频采样技术,将多模态推理吞吐量提升最高 9 倍,显著降低延迟与显存占用。相比传统三模型拼接方案,它更适合构建高并发 AI Agent,支持本地消费级显卡运行,已在文档智能、客服等场景验证实际价值。

#开源模型
阅读全文
互动讨论

评论区

围绕《Google 测试 Gemini 桌面版屏幕共享 Live Mode》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。