Nano Banana!Gemini 的图片编辑功能迎来重大升级

Gemini 推出全新图片编辑模型 Nano Banana,显著提升人物特征一致性,支持换装、换景、多图合成、多轮编辑与风格迁移。免费用户可用,所有生成图均带可见水印及 SynthID 隐形水印,兼顾创意自由与内容可追溯性。

发布于2025年8月28日 01:58
编辑零重力瓦力
评论0
阅读49

Gemini 应用正式推出了由 Google DeepMind 开发的全新图片编辑模型 Nano Banana。这款模型被认为是全球评价最高的图片编辑模型。现在,它已集成到 Gemini 应用中,让用户能够以前所未有的方式掌控照片创作,打造理想画面。

编辑照片,保留本来面貌

今年早些时候,Gemini 应用上线了原生图片编辑功能,团队一直在不断优化,特别关注于在不同图片中保持人物特征的一致性。团队了解到,当用户编辑自己或熟悉的人的照片时,哪怕细微的差别也会影响体验。因此,这次升级专门针对这一问题设计,无论是为朋友、家人还是宠物换发型、加服装,都能在每张照片中保持原本的样子。

用户只需上传一张照片,告诉 Gemini 需要怎样调整,就能轻松添加独特的风格。Gemini 还支持合成照片,例如把用户和宠物放在同一画面里,或更换房间背景,预览新壁纸,甚至能让用户“穿越”到世界任何地方,而原有形象始终如一。编辑完成后,用户还可以将新照片再次上传至 Gemini,将静态图片变成有趣的视频。

用高级编辑功能实现创意

以下是用户可以在 Gemini 新图片编辑功能中尝试的一些玩法:

换服装、换场景

上传人物或宠物的照片,模型会在各种新场景下始终保持其原有样貌。用户可以尝试不同的服装、职业,甚至穿越到其他年代,但本来的形象不会改变。

合成多张照片

现在可以上传多张照片,将它们融合成一个全新场景。例如,将用户和宠物的照片合成为一张,共同出现在篮球场上。

多轮编辑

用户可以持续编辑 Gemini 生成的图片。比如,先上传一间空房,为墙壁换颜色,再添加书架、家具、咖啡桌等。每一步 Gemini 都会与用户协作,只改变指定部分,其余保持不变。

设计混搭

将一张图片的风格应用到另一张图片的物体上。例如,把花瓣的色彩和纹理用在雨靴上,或者用蝴蝶翅膀的图案设计一条裙子。

无论是付费还是免费用户,全球用户都可以在 Gemini 应用中体验此次升级的图片编辑功能。所有在 Gemini 应用中创作或编辑的图片都会添加明显的水印,以及专有的 SynthID 隐形水印,确保人们能够一眼识别这些图片为 AI 生成。

原文链接

Nano Banana! Image editing in Gemini just got a major upgrade

相关文章

一段代码让网站出海,这个 AI 翻译工具把多语言 SEO 玩明白了
AI 产品工具
2026年6月1日
0 条评论
小创

一段代码让网站出海,这个 AI 翻译工具把多语言 SEO 玩明白了

跨境电商网站常因语言壁垒导致高跳出率。Weglot 是一款 AI 翻译工具,仅需几分钟即可通过添加脚本实现网站多语言本地化,且保持原有排版。该工具支持可视化编辑、术语表锁定及团队协作,便于后续维护。同时,它能自动优化 hreflang 标签、独立 URL 及元数据,解决多语言 SEO 难题。借助母语内容布局小语种市场,企业可以低成本获取流量红利,有效提升海外转化率。

阅读全文
SCOPE 给 AI 绘画装上了 “语义追踪器”,复杂提示词终于不用反复抽卡了
AI 产品工具
2026年6月1日
0 条评论
零重力瓦力

SCOPE 给 AI 绘画装上了 “语义追踪器”,复杂提示词终于不用反复抽卡了

中科大团队发布 SCOPE 框架,通过结构化语义规格解决 AI 绘画中复杂提示词语义丢失问题。该系统将提示词拆解为实体、约束及未知项,构建包含分解、合成、生成、验证的四步循环,并辅以检索、推理和修复技能,实现生成过程全程可追溯与精准修复。团队还推出 Gen-Arena 评测基准及 EGIP 指标。实验显示 SCOPE 在多项基准中表现优异,为多元素控制场景提供了工程化解决方案,代码已开源。

#AI 绘画
阅读全文
Stable Audio 3.0 发布:开源音频生成从 11 秒走到 6 分钟
AI 产品工具
2026年5月28日
0 条评论
零重力瓦力

Stable Audio 3.0 发布:开源音频生成从 11 秒走到 6 分钟

Stability AI 发布开源音频模型 Stable Audio 3.0,最长可生成 6 分 20 秒立体声音频。该模型采用 SAME 架构实现 4096 倍压缩,支持变量长度生成与局部编辑,Small 版本可在移动端离线运行。训练数据均获授权,规避版权风险。提供四个变体及 LoRA 微调文档,社区许可允许商用。此次升级标志着开源音频生成从短音效迈向完整歌曲创作,为开发者提供了本地化、合规的高质量音频生成方案。

#开源模型#AI 音乐
阅读全文
互动讨论

评论区

围绕《Nano Banana!Gemini 的图片编辑功能迎来重大升级》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。