Gemini 2.0 Flash (Image Generation) 终极图像编辑工具

Gemini 2.0 Flash(图像生成)上线Google AI Studio,免费提供基于自然语言的智能图像编辑能力:支持精准元素替换、多图融合、人物一致性保持、视角与构图调整、物理场景理解重设计、水印去除及情节化插图生成,大幅降低专业级图像编辑门槛。

发布于2025年3月17日 08:05
编辑零重力瓦力
评论0
阅读42

Gemini 2.0 Flash (Image Generation) 已经彻底颠覆了图形编辑的传统方式。通过简单的自然语言指令,它就能轻松完成那些以往用 Photoshop、Midjourney 等传统图像编辑工具或 AI 绘画软件需要耗费大量时间,甚至难以实现的任务。那么,它究竟有哪些令人惊叹的神奇功能呢?让我们一起来看看吧!

精准替换图像中的元素

Have her hold the pink iphone instead of the green object
让她拿着粉色的 iPhone,而不是绿色的物体

将不同的图像融合在一起

Gemini 2.0 Flash (Image Generation) 终极图像编辑工具

Gemini 2.0 Flash (Image Generation) 终极图像编辑工具

Gemini 2.0 Flash (Image Generation) 终极图像编辑工具

Let the model wear this jacket, same pose
让模特穿上这件夹克,保持相同的姿势

修改人物图像并保持一致性

Gemini 2.0 Flash (Image Generation) 终极图像编辑工具

Create a square passport photo of the blonde woman on the right with a neutral face expression on a while background
为右侧的金发女性创建一张中性表情、白色背景的方形护照照片

Gemini 2.0 Flash (Image Generation) 终极图像编辑工具

Please make a side view of this photo
请将这张照片改为侧视图

Gemini 2.0 Flash (Image Generation) 终极图像编辑工具

Please make a zoomed out view of this photo, to show here full body pose
请将这张照片拉远,展示她的全身姿势

重新设计照片

Gemini 能够理解照片中的现实物理世界,并能够对齐进行修改。

Gemini 2.0 Flash (Image Generation) 终极图像编辑工具

make the furniture go away
让家具消失
decorate it with a modern chic aesthetic
用现代时尚的风格装饰它

去除水印

Gemini 2.0 Flash (Image Generation) 终极图像编辑工具

Remove the "Shutterstock" watermark from this image
从这张图片中移除“Shutterstock”水印

绘制连续有情节的插图

Gemini 2.0 Flash (Image Generation) 终极图像编辑工具

Gemini 2.0 Flash (Image Generation) 终极图像编辑工具

Gemini 2.0 Flash (Image Generation) 终极图像编辑工具

Write an illustrated story about AlphaFold for toddlers.
为幼儿写一个关于 AlphaFold 的插图故事

目前可以通过 Google AI Studio 免费使用这项新的工具

相关文章

Gemini 3.5 Flash 编码实测
AI 产品工具
2026年5月22日
0 条评论
零重力瓦力

Gemini 3.5 Flash 编码实测

Gemini 3.5 Flash 在 3D 飞机避障游戏代码生成能力上较 3.1 Pro 有明显提升,飞机模型更精致、新增粒子尾焰与地面光照投影,操控手感优化。但整体效果仍不及 GPT 5.5。

#Gemini
阅读全文
谷歌发布全新视频模型 Gemini Omni,视频编辑迎来质变
AI 新闻资讯
2026年5月22日
0 条评论
小创

谷歌发布全新视频模型 Gemini Omni,视频编辑迎来质变

Google I/O 大会上,DeepMind 团队推出全新多模态视频模型 Gemini Omni,被视为视频领域的 “Nano Banana”。该模型从底层架构重新设计,支持图像、视频和音频混合输入,通过日常语言即可完成复杂视频编辑。其核心优势在于高可控性和时间维度感知,例如可让画面中的物体凭空消失或改变摄像机视角,同时保持背景与动作一致。用户仅需提供几张照片和一段语音,即可生成高度还原的个人虚拟分身。Omni 还展现出未经过专门训练的涌现能力,如自动同步视频与音乐节奏、根据剧情逻辑续写场景。

#Gemini#视频编辑#视频生成
阅读全文
Gemini File Search 支持图片了:多模态 RAG 从此不只是文本检索
AI 产品工具
2026年5月6日
0 条评论
零重力瓦力

Gemini File Search 支持图片了:多模态 RAG 从此不只是文本检索

5 月 5 日,Google Gemini API 的 File Search 新增多模态检索、元数据过滤及页码引用功能。核心在于引入原生多模态嵌入模型,支持直接对图片、图表进行语义搜索,无需依赖 OCR。该托管服务大幅降低自建 RAG 系统的开发门槛,适合需处理大量视觉资料的企业或开发者。不过需注意其暂不支持音视频格式,且一旦选定嵌入模型无法无缝升级。

#RAG#Gemini#Google
阅读全文
互动讨论

评论区

围绕《Gemini 2.0 Flash (Image Generation) 终极图像编辑工具》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。