Nano Banana 2 图像生成能力抢先体验

Nano Banana 2 将于11月11日发布,支持2K原生输出与多种纵横比,采用多步生成+自我纠错机制,在色彩控制、视角调整和文本修正上显著突破;当前预览版基于Gemini 2.5 Flash,代号GEMPIX 2,精度与稳定性提升三倍,或更名“Nano Banana Pro”。

发布于2025年11月9日 09:14
编辑零重力瓦力
评论0
阅读53

MarsEverythingTech, Alexey Shabanov 在 TestingCatalog 上撰文表示 Nano Banana 2 将于 11 月 11 日正式发布,该版本将支持 2 K 原生输出,并在多个关键领域实现重大突破,该模型预计基于 Gemini 3.0 Pro 开发。

Nano Banana 模型在 Gemini 应用及相关 Google 产品中广受好评,Google 正加速推进 Nano Banana 2 的发布工作。这次更新的亮点在于大幅提升了复杂任务的处理能力,包括精确色彩控制、高级视角调整,以及对图像中文本元素的精准修正。这些恰恰是现有版本(Nano Banana 1)存在明显短板的领域。从泄露的图像样本来看,新版本在视觉质量上实现了质的飞跃,成功解决了此前无法处理的诸多问题。

”“
在 Media AI 平台,通过 Nano Banana 2 生成的作品:“赛博朋克风格的黑客机器人正在多屏幕前工作”(图片来源:pic.twitter.com/o1nFaaDks4)

值得一提的是,Nano Banana 2 近期(疑似意外地)在 Media AI 平台上以预览版形式开放了访问。该预览版本的输出效果,与此前在 Gemini 平台短暂上线时确认的 Nano Banana 2 生成结果完全吻合。

根据内部观察,Nano Banana 2 目前仍在使用 Gemini 2.5 Flash 作为底层模型,而非完全升级至 Gemini 3.0 Pro。这一技术选择可能意味着产品将提前发布,待新版基础模型成熟后再进行升级。特别引人注目的是,该模型采用了全新的多步骤生成机制。系统会先花费大量时间进行输出规划,随后生成初始图像,再通过内置的图像分析功能进行自我审查,精准识别并修正错误,必要时进行多轮迭代优化,最终才向用户呈现成品。这种迭代纠错机制在以往版本中从未出现,对于有高精度需求的用户而言意义重大。

9 月 30 日流出的 Nano Banana 2 信息

最新的内部测试结果和 GitHub 代码提交记录显示,该产品正进行品牌升级,新名称为“Nano Banana Pro”,这反映了其在指令理解能力上的显著进步。据称,与早期的 Nano Banana 2 测试版相比,新版本的准确性和稳定性提升了整整三倍。在极限测试场景中,比如模拟“碎片化”后重建图像的任务,该模型展现出了即便在全新会话中也能保持输出一致性的强大能力。

功能层面的更新同样值得关注,新版本扩展了纵横比支持范围(涵盖 1:1、2:3、3:2、3:4、4:3、9:16、16:9 和 21:9),并提供了更丰富的分辨率选项,代码中明确标注了 1 K、2 K 和 4 K 三种输出模式。这些增强功能将为创意工作者和专业用户提供更大的创作灵活性。

”“
Nano Banana 2 生成作品:“雪中,金木研将朋友抱在怀中——《东京食尸鬼》场景”(图片来源:pic.twitter.com/tXWLtyuacF)

目前社区讨论的焦点集中在:Nano Banana 2(内部代号 GEMPIX 2)究竟是基于 Imagen 4 构建,还是延续第一代的做法,继续使用 Gemini 3 Pro 或 Flash。此外,有传言称可能会推出多个产品版本,其中“Nano Banana Pro”很可能会主打高分辨率支持特性。不过,这些信息尚未获得官方证实。从种种迹象来看,正式发布已进入倒计时。内部测试正在紧锣密鼓地进行,Gemini 用户界面中也已出现预告卡片,按照惯例这通常意味着产品将在数日内正式面世。

”“
Nano Banana 2(通过 Media AI 平台生成),图片提供者 x:legit_api

Nano Banana 1 与 Nano Banana 2 对比

”“
Nano Banana 1

”“
Nano Banana 2

”“
Nano Banana 1

”“
Nano Banana 2

”“
Nano Banana 1

”“
Nano Banana 2

据了解,GEMPIX 2 的应用范围不会局限于 Gemini 应用本身。Google 正计划将其推广至其他实验性项目,比如 Whisk 实验室项目,这延续了上一代 Nano Banana 模型的多平台部署策略。对于 Google AI 生态系统的广大用户群体。无论是创意从业者、产品设计师还是技术爱好者——此次更新都意味着能够获得更强大的创作控制能力和更高品质的输出效果,这很可能将深刻改变消费级和专业级应用场景中的现有工作流程。关于底层模型的详细规格以及在 Google 生态系统中的具体更新范围,所有答案都将在正式发布时揭晓。

相关文章

Visa 把支付网络接进了 ChatGPT,AI 智能体终于能自己花钱了
AI 新闻资讯
2026年6月18日
0 条评论
零重力瓦力

Visa 把支付网络接进了 ChatGPT,AI 智能体终于能自己花钱了

Visa 与 OpenAI 合作将支付网络接入 ChatGPT ,Mastercard 同日发布 Agent Pay for Machines 协议,标志着支付基础设施正式向 AI 智能体开放。Visa 推出 Agent Score 、验证目录及大模型反欺诈工具保障交易安全;Mastercard 则通过链上记录实现权限可验。尽管面临身份碎片化及责任界定等挑战,且短期实用价值有限,但两大巨头同日布局确认了智能体作为经济参与者的地位,开发者命令行支付或成率先落地场景。

#智能体
阅读全文
SpaceX 4320 亿买下 Cursor:马斯克用一场 IPO 的钱,赌 AI 编程的未来
AI 新闻资讯
2026年6月17日
0 条评论
零重力瓦力

SpaceX 4320 亿买下 Cursor:马斯克用一场 IPO 的钱,赌 AI 编程的未来

SpaceX 以 600 亿美元全股票收购 AI 编程工具 Cursor,旨在补齐企业级 AI 产品短板并推广自研 Grok 模型。此举将算力基础设施与产品入口结合,但面临 xAI 团队动荡及文化冲突风险。收购后 Cursor 或调整定价、深度整合 Grok 模型,个人用户权益存变数。交易预计三季度完成,建议开发者关注产品路线图转向及核心人员流失信号,同时该交易也为 AI 编程赛道确立了新估值锚点。

阅读全文
Google 搜索变身全天候智能体:Information Agents 上线,你的数据终于开始替你干活了
AI 产品工具
2026年6月15日
0 条评论
零重力瓦力

Google 搜索变身全天候智能体:Information Agents 上线,你的数据终于开始替你干活了

Google 推出 Information Agents 功能,面向 AI Ultra 订阅用户开放。该功能将搜索从被动查询转变为主动监测,智能体可 7×24 小时追踪用户需求并推送变化信息。其底层依托 Personal Intelligence 战略,通过整合 Gmail、Photos 等跨应用数据实现个性化推理。尽管存在隐私与准确性挑战,但凭借二十年数据积累,Google 正推动 AI 助手从对话工具向自主代理进化,重塑“信息找人”的交互范式。

#Google#智能体
阅读全文
互动讨论

评论区

围绕《Nano Banana 2 图像生成能力抢先体验》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。