资讯标签

#Gemini

2026年6月4日

Gemini Spark：谷歌的 24/7 个人助手，到底能不能帮你干活

谷歌向美国 AI Ultra 用户开放 Gemini Spark，打造全天候后台 AI 助手。该产品通过 Task、Schedule、Skill 三大组件实现邮件摘要、行程规划及远程浏览器操作等自动化任务，面向普通用户提供开箱即用体验。其月费约 720 元，虽具备代码执行能力，但存在并发限制、支付功能缺失、生态封闭及隐私隐患等问题。Spark 适合 Google Workspace 重度用户，未来若开放 API 接入 Android 系统，或将成为重要的 Agent 分发平台。

Gemini 3.5 Flash 编码实测

Gemini 3.5 Flash 在 3D 飞机避障游戏代码生成能力上较 3.1 Pro 有明显提升，飞机模型更精致、新增粒子尾焰与地面光照投影，操控手感优化。但整体效果仍不及 GPT 5.5。

谷歌发布全新视频模型 Gemini Omni，视频编辑迎来质变

Google I/O 大会上，DeepMind 团队推出全新多模态视频模型 Gemini Omni，被视为视频领域的 “Nano Banana”。该模型从底层架构重新设计，支持图像、视频和音频混合输入，通过日常语言即可完成复杂视频编辑。其核心优势在于高可控性和时间维度感知，例如可让画面中的物体凭空消失或改变摄像机视角，同时保持背景与动作一致。用户仅需提供几张照片和一段语音，即可生成高度还原的个人虚拟分身。Omni 还展现出未经过专门训练的涌现能力，如自动同步视频与音乐节奏、根据剧情逻辑续写场景。

Gemini File Search 支持图片了：多模态 RAG 从此不只是文本检索

5 月 5 日，Google Gemini API 的 File Search 新增多模态检索、元数据过滤及页码引用功能。核心在于引入原生多模态嵌入模型，支持直接对图片、图表进行语义搜索，无需依赖 OCR。该托管服务大幅降低自建 RAG 系统的开发门槛，适合需处理大量视觉资料的企业或开发者。不过需注意其暂不支持音视频格式，且一旦选定嵌入模型无法无缝升级。

Google 发布 Gemini Enterprise 智能体平台

Google 发布新版 Gemini Enterprise ，将其从聊天工具升级为面向大型企业的统一智能体平台。新平台整合了应用开发入口 Agent Platform 、员工使用入口及安全治理框架，支持开发者、 IT 团队和知识工作者构建、管理和治理跨工作流的 AI 智能体。平台整合 200 多个模型，提供低代码工具、多智能体系统及长时运行能力，并配备身份认证、注册与策略执行等完整安全机制。 Google 此举旨在解决企业 AI 碎片化问题，但平台越完整也意味着企业越容易被锁进生态。

8 个 Gemini 技巧，整理空间和生活

Google 发布 Gemini 家庭场景使用指南，涵盖清洁清单、杂物诊断、冰箱食材管理、维修指导、地图购物、植物护理及邮件整理等 8 大应用。 Gemini 正从聊天机器人转型为能看图、会对话、可联动 Gmail 、地图等服务的日常智能体，利用 Google 产品网络优势，将 AI 从办公场景推向水槽、冰箱等生活细节。其核心策略是通过高频琐碎的家务入口，让 AI 接手那些耗时却无人愿处理的小事。

Gemini Drops ： 2026 年 4 月 Gemini 应用新更新

Google 在 Gemini Drops 第 10 期中推出多项更新，将 Gemini 从问答工具升级为深度嵌入工作流的 AI 入口。新增功能包括图像个性化、 Google 应用连接、项目管理工具 Notebooks 、 Mac 原生客户端、音乐创作 Lyria 3 Pro 及交互式可视化。核心方向是让 Gemini 更贴近用户的内容与任务处理场所，但个性化越深，数据边界与用户信任的挑战也越大。

十家领先企业揭示：智能体如何创造商业价值

Google Cloud 在 Next'26 大会上展示了智能体企业的最新实践。 10 家头部企业已将 AI 智能体嵌入测试、研发、采购、客服、制造、投研和安全响应等高价值流程，覆盖游戏、金融、零售、医药、制造、快消、旅游和通信等行业。这些案例表明，智能体正从“聊天机器人”进化为企业运营体系的核心组成部分。真正的竞争门槛不再是模型能力，而是数据数字化、基础设施稳定性和业务流程改造。企业级 AI 的评估口径已从“能力演示”转向“流程接管率”和“单位经济性”。

Gemini for Home 引入 Continued Conversation ，让聊天更自然高效

Google 为 Gemini for Home 推出“持续对话”功能，旨在解决智能家居语音交互中频繁唤醒、上下文丢失、误响应等体验短板。核心升级包括：支持对话上下文记忆、多语言覆盖、智能区分闲聊与指令，以及全屋用户共享使用。该功能让语音助手从一问一答模式向自然连续交流演进。分析认为， AI 进家门后竞争焦点已转向“打断更少、理解更准、接话更自然”的交互体验，家庭场景对 AI 的要求苛刻，真正做好连续对话和“少打扰”才能确立智能家居入口的主动权。

#Gemini

阅读全文

共 80 篇文章，第 1 / 9 页