Nano Banana 2 图像生成能力抢先体验

Nano Banana 2 将于11月11日发布,支持2K原生输出与多种纵横比,采用多步生成+自我纠错机制,在色彩控制、视角调整和文本修正上显著突破;当前预览版基于Gemini 2.5 Flash,代号GEMPIX 2,精度与稳定性提升三倍,或更名“Nano Banana Pro”。

发布于2025年11月9日 09:14
编辑零重力瓦力
评论0
阅读26

MarsEverythingTech, Alexey Shabanov 在 TestingCatalog 上撰文表示 Nano Banana 2 将于 11 月 11 日正式发布,该版本将支持 2 K 原生输出,并在多个关键领域实现重大突破,该模型预计基于 Gemini 3.0 Pro 开发。

Nano Banana 模型在 Gemini 应用及相关 Google 产品中广受好评,Google 正加速推进 Nano Banana 2 的发布工作。这次更新的亮点在于大幅提升了复杂任务的处理能力,包括精确色彩控制、高级视角调整,以及对图像中文本元素的精准修正。这些恰恰是现有版本(Nano Banana 1)存在明显短板的领域。从泄露的图像样本来看,新版本在视觉质量上实现了质的飞跃,成功解决了此前无法处理的诸多问题。

”“
在 Media AI 平台,通过 Nano Banana 2 生成的作品:“赛博朋克风格的黑客机器人正在多屏幕前工作”(图片来源:pic.twitter.com/o1nFaaDks4)

值得一提的是,Nano Banana 2 近期(疑似意外地)在 Media AI 平台上以预览版形式开放了访问。该预览版本的输出效果,与此前在 Gemini 平台短暂上线时确认的 Nano Banana 2 生成结果完全吻合。

根据内部观察,Nano Banana 2 目前仍在使用 Gemini 2.5 Flash 作为底层模型,而非完全升级至 Gemini 3.0 Pro。这一技术选择可能意味着产品将提前发布,待新版基础模型成熟后再进行升级。特别引人注目的是,该模型采用了全新的多步骤生成机制。系统会先花费大量时间进行输出规划,随后生成初始图像,再通过内置的图像分析功能进行自我审查,精准识别并修正错误,必要时进行多轮迭代优化,最终才向用户呈现成品。这种迭代纠错机制在以往版本中从未出现,对于有高精度需求的用户而言意义重大。

9 月 30 日流出的 Nano Banana 2 信息

最新的内部测试结果和 GitHub 代码提交记录显示,该产品正进行品牌升级,新名称为“Nano Banana Pro”,这反映了其在指令理解能力上的显著进步。据称,与早期的 Nano Banana 2 测试版相比,新版本的准确性和稳定性提升了整整三倍。在极限测试场景中,比如模拟“碎片化”后重建图像的任务,该模型展现出了即便在全新会话中也能保持输出一致性的强大能力。

功能层面的更新同样值得关注,新版本扩展了纵横比支持范围(涵盖 1:1、2:3、3:2、3:4、4:3、9:16、16:9 和 21:9),并提供了更丰富的分辨率选项,代码中明确标注了 1 K、2 K 和 4 K 三种输出模式。这些增强功能将为创意工作者和专业用户提供更大的创作灵活性。

”“
Nano Banana 2 生成作品:“雪中,金木研将朋友抱在怀中——《东京食尸鬼》场景”(图片来源:pic.twitter.com/tXWLtyuacF)

目前社区讨论的焦点集中在:Nano Banana 2(内部代号 GEMPIX 2)究竟是基于 Imagen 4 构建,还是延续第一代的做法,继续使用 Gemini 3 Pro 或 Flash。此外,有传言称可能会推出多个产品版本,其中“Nano Banana Pro”很可能会主打高分辨率支持特性。不过,这些信息尚未获得官方证实。从种种迹象来看,正式发布已进入倒计时。内部测试正在紧锣密鼓地进行,Gemini 用户界面中也已出现预告卡片,按照惯例这通常意味着产品将在数日内正式面世。

”“
Nano Banana 2(通过 Media AI 平台生成),图片提供者 x:legit_api

Nano Banana 1 与 Nano Banana 2 对比

”“
Nano Banana 1

”“
Nano Banana 2

”“
Nano Banana 1

”“
Nano Banana 2

”“
Nano Banana 1

”“
Nano Banana 2

据了解,GEMPIX 2 的应用范围不会局限于 Gemini 应用本身。Google 正计划将其推广至其他实验性项目,比如 Whisk 实验室项目,这延续了上一代 Nano Banana 模型的多平台部署策略。对于 Google AI 生态系统的广大用户群体。无论是创意从业者、产品设计师还是技术爱好者——此次更新都意味着能够获得更强大的创作控制能力和更高品质的输出效果,这很可能将深刻改变消费级和专业级应用场景中的现有工作流程。关于底层模型的详细规格以及在 Google 生态系统中的具体更新范围,所有答案都将在正式发布时揭晓。

相关文章

OpenAI 发布 GPT-5.5 ,向 AI“超级应用”迈出关键一步
AI 新闻资讯
2026年4月25日
0 条评论
小创

OpenAI 发布 GPT-5.5 ,向 AI“超级应用”迈出关键一步

OpenAI 发布 GPT-5.5 ,号称“最智能”模型。该模型思考速度更快、 Token 效率更高,朝“超级应用”目标迈出重要一步。新版本覆盖企业编码、知识工作及科学研究等场景,在多项基准测试中领先 Google Gemini 和 Anthropic Claude 。 CEO Brockman 表示此举让前沿 AI 能力同时惠及企业和消费者,首席科学家 Pachocki 则直言“过去两年发展缓慢令人意外”,暗示 AI 潜力仍远未触顶。

#OpenAI#ChatGPT
阅读全文
DeepSeek 新模型发布,缩小与前沿模型差距
AI 新闻资讯
2026年4月25日
0 条评论
小创

DeepSeek 新模型发布,缩小与前沿模型差距

DeepSeek 发布 V4 系列模型( Flash 与 Pro ),采用 MoE 架构,拥有 100 万 Token 上下文窗口。 Pro 总参数 1.6 万亿、活跃参数 490 亿,在代码推理任务上可与 GPT-5.4 竞争,部分任务超越 GPT-5.2 和 Gemini 3.0 Pro ,但知识类测试仍落后 3-6 个月。 V4 系列最大优势是极有竞争力的定价。Flash 每百万 Token 输入仅 0.14 美元, Pro 输入 0.145 美元,直接击穿主流竞品价格底线。

#DeepSeek
阅读全文
“AI 科切拉”盛会:斯坦福学生排队学习硅谷大佬经验
AI 新闻资讯
2026年4月24日
0 条评论
小创

“AI 科切拉”盛会:斯坦福学生排队学习硅谷大佬经验

斯坦福 CS 153 课程因邀请 Sam Altman 、 黄仁勋等科技大佬演讲走红, 500 个席位迅速被抢空。批评者认为这将稀缺教育资源变成“现场播客”,模糊了课堂与利益交换的边界。支持者则强调直接接触一线创业者和投资人的价值。文章指出,在知识日益廉价的时代,这门课爆红的本质在于将稀缺的人脉和机会入口做成了课程产品,揭示了顶尖学府最不便明说的现实!教育卖的不仅是知识,更是接近权力与资源网络的许可。

阅读全文
互动讨论

评论区

围绕《Nano Banana 2 图像生成能力抢先体验》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。