Gemini for Home 引入 Continued Conversation ,让聊天更自然高效

Google 为 Gemini for Home 推出“持续对话”功能,旨在解决智能家居语音交互中频繁唤醒、上下文丢失、误响应等体验短板。核心升级包括:支持对话上下文记忆、多语言覆盖、智能区分闲聊与指令,以及全屋用户共享使用。该功能让语音助手从一问一答模式向自然连续交流演进。分析认为, AI 进家门后竞争焦点已转向“打断更少、理解更准、接话更自然”的交互体验,家庭场景对 AI 的要求苛刻,真正做好连续对话和“少打扰”才能确立智能家居入口的主动权。

发布于2026年4月27日 15:50
编辑小创
评论0
阅读27

Gemini for Home 上线“持续对话”功能, Google 开始补上智能家居语音交互里最影响体验的一块短板。

Google 表示,自 Gemini for Home 开放早期体验以来,已有数百万用户通过日常使用和反馈参与产品打磨。现在,这项用户呼声很高的“持续对话”功能正式推出。开启后,用户在第一次说出“Hey Google”并完成一轮请求后, Gemini 会先给出回答,同时让麦克风继续保持几秒钟开启状态。设备上会出现脉动灯效,用户可以直接接着说,不必重新唤醒。

这次升级的核心,不只是让对话“能接着聊”,而是把过去智能音箱里那种一问一答、频繁唤醒的割裂体验,往更自然的连续交流推进了一步。 Google 给出的变化主要集中在四个方面。

一是对话上下文能力。和 Google Assistant 相比, Gemini 能记住当前对话的上下文,因此用户在追问时不需要反复重复前文信息,连续交流会更顺畅。

二是多语言支持。这版升级后的“持续对话”并不局限于美式英语,而是在全球所有已支持语言和地区上线。对一个面向家庭场景的语音助手来说,这比单纯扩展功能本身更重要,因为家庭环境本来就天然混杂着不同口音、语言切换和多成员使用。

三是更聪明的“侧边谈话”识别能力。 Google 称,改进后的 AI 能更好地区分正式指令与家庭成员之间的日常闲聊,从而减少设备误触发和误响应。这个点看着不起眼,其实很现实。智能音箱进了客厅以后,用户最烦的往往不是“听不懂”,而是“不该接话的时候偏偏接话”。

四是全屋可用。功能一旦启用,家中的所有人,包括访客,都可以使用“持续对话”。这意味着它不是绑定某一个人的个性化能力,而是被设计成一项面向整个家庭空间的默认交互方式。

Google 也给出了开启路径。用户需要进入 Google Home 应用,依次打开“家庭设置”,进入“Gemini for Home 语音助手”,再开启“持续对话”。

想了解更多关于“持续对话”以及其他 Gemini 升级内容, Google 引导用户前往 Google Home 社区页面查看。

这项更新发布在 Google Nest 和 Gemini 相关产品动态中。从产品节奏看, Google 现在显然不满足于把 Gemini 塞进现有硬件,而是在重新定义家庭语音入口的交互逻辑。说白了, AI 进家门之后,拼的已经不只是回答问题的能力,而是谁能把“打断更少、理解更准、接话更自然”这三件事做得更像人与人说话。

创艺洞察

这次更新没有讲太多宏大叙事,反而把力气用在几个很具体的摩擦点上,比如反复唤醒、上下文丢失、误响应。这样的产品调整通常比参数升级更能改变用户感知。家庭场景对 AI 的要求一直很苛刻,因为它不是办公软件,用户没有耐心迁就系统。 Gemini for Home 如果真能把连续对话和“少打扰”同时做好, Google 在智能家居入口上的主动权,才算真正往前迈了一步。

相关文章

一段代码让网站出海,这个 AI 翻译工具把多语言 SEO 玩明白了
AI 产品工具
2026年6月1日
0 条评论
小创

一段代码让网站出海,这个 AI 翻译工具把多语言 SEO 玩明白了

跨境电商网站常因语言壁垒导致高跳出率。Weglot 是一款 AI 翻译工具,仅需几分钟即可通过添加脚本实现网站多语言本地化,且保持原有排版。该工具支持可视化编辑、术语表锁定及团队协作,便于后续维护。同时,它能自动优化 hreflang 标签、独立 URL 及元数据,解决多语言 SEO 难题。借助母语内容布局小语种市场,企业可以低成本获取流量红利,有效提升海外转化率。

阅读全文
SCOPE 给 AI 绘画装上了 “语义追踪器”,复杂提示词终于不用反复抽卡了
AI 产品工具
2026年6月1日
0 条评论
零重力瓦力

SCOPE 给 AI 绘画装上了 “语义追踪器”,复杂提示词终于不用反复抽卡了

中科大团队发布 SCOPE 框架,通过结构化语义规格解决 AI 绘画中复杂提示词语义丢失问题。该系统将提示词拆解为实体、约束及未知项,构建包含分解、合成、生成、验证的四步循环,并辅以检索、推理和修复技能,实现生成过程全程可追溯与精准修复。团队还推出 Gen-Arena 评测基准及 EGIP 指标。实验显示 SCOPE 在多项基准中表现优异,为多元素控制场景提供了工程化解决方案,代码已开源。

#AI 绘画
阅读全文
Stable Audio 3.0 发布:开源音频生成从 11 秒走到 6 分钟
AI 产品工具
2026年5月28日
0 条评论
零重力瓦力

Stable Audio 3.0 发布:开源音频生成从 11 秒走到 6 分钟

Stability AI 发布开源音频模型 Stable Audio 3.0,最长可生成 6 分 20 秒立体声音频。该模型采用 SAME 架构实现 4096 倍压缩,支持变量长度生成与局部编辑,Small 版本可在移动端离线运行。训练数据均获授权,规避版权风险。提供四个变体及 LoRA 微调文档,社区许可允许商用。此次升级标志着开源音频生成从短音效迈向完整歌曲创作,为开发者提供了本地化、合规的高质量音频生成方案。

#开源模型#AI 音乐
阅读全文
互动讨论

评论区

围绕《Gemini for Home 引入 Continued Conversation ,让聊天更自然高效》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。