Gemini 新功能:Canvas、深度研究和个性化的融合

Gemini 推出 Canvas 可视化编辑与零代码网页生成、升级版深度研究(支持溯源追踪与实时思考可见)及基于搜索历史的个性化推荐三大功能,依托 Gemini 2.0 思考模型深度融合,让 AI 助手更自然、可信、主动,逐步成为理解用户、主动服务的个人智能助理。

发布于2025年3月20日 10:04
编辑零重力瓦力
评论0
阅读64

最近 Google 为 Gemini 带来了一系列重要更新,在功能和用户体验上,逐渐拉进了与 ChatGPT 的差距,甚至大有赶超之意。其中最引人注目的三项新功能:Gemini Canvas、升级版深度研究和个性化功能,共同构建了一个更强大、更贴近用户需求的 AI 助手生态系统。

Gemini Canvas:从创意到代码的无缝转换

Gemini Canvas 的推出解决了 AI 交互中的一个根本性问题:如何在多轮对话中高效地创建和编辑内容。过去在使用 AI 助手时,用户往往需要在每次交互中重复指定哪些部分需要修改,哪些部分需要保留,这种体验相当繁琐。

Canvas 模式提供了一个类似 Google 文档的编辑体验,用户可以直接在界面上进行编辑,选择特定段落请求反馈,调整格式,并且与模型实时协作。这种交互方式使创意工作变得更加流畅,也更符合人们习惯的工作流程。

Canvas 的代码功能,能够创建完整的交互式网页应用,甚至是具有复杂动画和功能的项目,如元素周期表、太阳系可视化或粒子模拟器等。即使是完全没有编程经验的用户,也能通过简单的提示创建专业级的网页应用,并通过分享功能与他人共享。

这一功能的价值在于它将编程的复杂性抽象化,让创意实现的门槛大大降低。正如 Gemini 应用团队的产品经理 Dave Citron 所说:"任何你能想象的东西,现在只需要一个提示就能构建。"

升级版深度研究:从快速回答到全面理解

深度研究功能于去年 12 月首次亮相,如今已与 Gemini 2.0 思考模型结合,并向所有用户免费开放。这项功能本质上是一种长时间运行的智能任务,能够替用户完成需要数小时的深入研究工作。

新版深度研究的突破在于用户可以实时观察 AI 的思考过程:例如,它正在访问哪些网站、如何评估这些信息、提出了哪些二级问题以及如何综合所有结果。这种透明度不仅增强了用户对结果的信任,也让研究过程本身变得可学习。

更重要的是,深度研究会提供详细的引用,用户可以追溯每个段落甚至句子的信息来源。这既保证了结果的可靠性,也帮助用户发现新的高质量信息源。结合 Gemini 的音频概述功能,用户甚至可以在通勤时间聆听这些研究报告,实现知识获取的高效率。

个性化功能:从陌生互动到熟悉理解

Gemini 的个性化功能标志着 AI 助手从事务性交互向真正个性化助手的转变。传统 AI 交互中,每次对话都像是重新开始,模型对用户一无所知,用户需要反复提供相同的上下文。

新功能允许用户选择连接 Google 搜索历史,让 Gemini 基于用户的搜索模式和兴趣提供更相关的回应。这种方式特别适用于推荐场景,比如度假目的地、音乐选择或其他个人兴趣领域。

谷歌在隐私和透明度方面采取了谨慎的态度。用户可以随时连接或断开这一功能,系统会通过引用卡片清晰标示哪些信息来源于个人数据。此外,思考模型确保只有在真正有帮助时才会使用个性化数据,避免过度依赖或误导性使用。

AI 复杂性与用户体验的平衡

这些新功能的融合代表了 AI 应用的一个关键发展方向:如何将日益复杂的 AI 技术转化为简单、自然的用户体验。当深度研究与个性化结合,再加上音频概述等功能时,背后是多个复杂模型的协作和交接,但用户感受到的却是一种近乎魔法的体验。

特别值得一提的是 Gemini 2.0 思考模型在推动这一转变中的核心作用。它不仅提高了各项功能的质量,还简化了开发过程。正如 Dave 所述,许多在早期版本需要通过复杂提示和监督微调实现的功能,在新模型中几乎自动完成,因为模型本身就具备更强的推理能力。

从行业趋势看,这些变化预示着 AI 助手将从单一功能工具转变为真正的个人助理,能够理解用户背景、学习用户偏好并主动提供有价值的服务。这也将改变人们与数字工具互动的方式,从指令驱动转向更自然、更对话式的交流。

虽然仍有用户体验和隐私平衡等挑战需要解决,但 Gemini 的这些新功能无疑为 AI 助手的未来发展提供了一个富有启发性的方向:不是更多功能,而是更智能地整合和简化,让技术真正融入人们的生活,而不是成为另一个需要学习和适应的复杂系统

相关文章

Claude 自己开机器狗:比人快20 倍,代码量只有十分之一
访谈案例
2026年6月21日
0 条评论
零重力瓦力

Claude 自己开机器狗:比人快20 倍,代码量只有十分之一

Anthropic 实验显示,Claude Opus 4.7 已能全程自主控制机器狗完成任务,速度比人类快约 20 倍,代码量仅为其十分之一。这标志着 AI 智能体正从辅助编程迈向物理工具自主操作阶段。但模型在实时闭环精细控制上仍有局限,且当前成果基于低复杂度任务。该进展体现了通用模型 scaling 的副产物效应,预示物理智能体时代早期来临,但距离解决复杂真实场景仍有差距。

#Claude#AI 编程
阅读全文
JetBrains Junie 正式版:AI 编程 Agent 学会了用调试器断点
AI 编程开发
2026年6月19日
0 条评论
零重力瓦力

JetBrains Junie 正式版:AI 编程 Agent 学会了用调试器断点

JetBrains AI 编程 Agent Junie 正式 GA,在 SWE-Rebench 基准测试中排名第一。其核心优势在于深度集成 IDE 原生工具链,而非模拟替代。主要特性包括:Plan 模式生成结构化计划文档以防跑偏;原生调试器集成支持断点与运行时状态检查;支持异步远程控制长任务;基于项目上下文的交互式代码审查;以及模型自由切换以优化成本。Junie 标志着 AI 编程竞争正从模型能力转向工具集成深度。

#智能体#AI 编程
阅读全文
Visa 把支付网络接进了 ChatGPT,AI 智能体终于能自己花钱了
AI 新闻资讯
2026年6月18日
0 条评论
零重力瓦力

Visa 把支付网络接进了 ChatGPT,AI 智能体终于能自己花钱了

Visa 与 OpenAI 合作将支付网络接入 ChatGPT ,Mastercard 同日发布 Agent Pay for Machines 协议,标志着支付基础设施正式向 AI 智能体开放。Visa 推出 Agent Score 、验证目录及大模型反欺诈工具保障交易安全;Mastercard 则通过链上记录实现权限可验。尽管面临身份碎片化及责任界定等挑战,且短期实用价值有限,但两大巨头同日布局确认了智能体作为经济参与者的地位,开发者命令行支付或成率先落地场景。

#智能体
阅读全文
互动讨论

评论区

围绕《Gemini 新功能:Canvas、深度研究和个性化的融合》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。