谷歌推出 Whisk:用图片和 AI 重新定义创意表达

谷歌实验室推出图片驱动AI工具Whisk,支持拖拽图片自动解构为“主题、场景、风格”三要素,并基于Gemini+Imagen 3重组生成全新创意图像。它不复制原图,而是提取视觉精髓,适合数字艺术、贴纸等快速创意探索。

发布于2024年12月17日 02:56
编辑零重力瓦力
评论0
阅读14

谷歌推出 Whisk:用图片和 AI 重新定义创意表达

2024 年 12 月 16 日,谷歌实验室(Google Labs)发布了一款全新的生成式 AI 工具:Whisk,它能够通过图片而非文字提示生成创意图像。这项新技术让用户能够通过将图片作为输入,重新混合主题、场景和风格,打造独一无二的视觉作品。

Whisk是什么?

Whisk 是一款以图片为核心的生成式 AI 工具,用户可以拖拽图片作为输入,包括以下三部分:

  • 主题:定义创作的核心对象。
  • 场景:设置背景环境。
  • 风格:决定图像的整体视觉效果。

奇幻鱼 - Whisk 生成的图像示例
奇幻鱼 - Whisk 生成的图像示例

古怪海象 - Whisk 生成的图像示例
古怪海象 - Whisk 生成的图像示例

撒糖釉面甜甜圈 - Whisk 生成的搪瓷徽章示例
撒糖釉面甜甜圈 - Whisk 生成的搪瓷徽章示例

长角奇幻猫 - Whisk 生成的图像示例
长角奇幻猫 - Whisk 生成的图像示例

Whisk 的特别之处在于,它并不复制输入图片,而是通过 AI 捕捉图片的 “精髓”,然后重新组合成全新的创意作品。无论是为数字艺术、贴纸设计,还是其他创意项目,Whisk 都能为用户提供快速试验和探索的可能性。

背后的技术

Whisk由两大AI模型驱动:

  • Gemini模型:分析用户输入的图片,自动生成详细的描述性文字。
  • Imagen 3模型:基于这些描述生成最终的图像。

这一过程让用户可以随意混合各种主题、场景和风格,而生成的作品总是带有独特的新意。虽然生成的图像并非完全还原原始图片,但这种“重塑”过程为创意提供了更多可能性。

测试与用户反馈

在早期测试中,艺术家和创意人士将 Whisk 视为一种全新的创作工具,而非传统的图片编辑器。它侧重于快速探索创意,而不是精确的像素编辑。用户可以尝试不同的设计选项,并下载自己满意的作品。

值得注意的是,由于 Whisk 仅提取图片的关键特征,生成的图像可能会在高度、体型、发型或肤色等方面与预期有所不同。但用户可以随时查看和编辑底层文字提示,以调整生成效果。

如何试用?

用户可以通过 labs.google/whisk (需使用美国 IP 访问) 体验这项创新技术并提供反馈。谷歌实验室表示,Whisk 的目标是为用户提供新的创意工具,同时让技术更贴近用户需求。

参考链接:Whisk: Visualize and remix ideas using images and AI

相关文章

Google I/O 2026 前瞻,这次 Google 压上了全部家当
AI 新闻资讯
2026年4月22日
0 条评论
小创

Google I/O 2026 前瞻,这次 Google 压上了全部家当

Google I/O 2026 定档 5 月 19 日至 20 日,被视为谷歌史上赌注最大的一届。核心看点包括 Gemini 4 首秀、Veo 4 视频生成升级及轻量级 AI 眼镜发布。更关键的是 Aluminium OS 桌面系统亮相,旨在补齐移动与桌面闭环。在千亿美元投入下,谷歌试图通过搜索、OS、硬件与智能体的全面重构,应对来自 GPT-6 等竞品的激烈挑战。

#Google
阅读全文
Genspark 4.0 创作者的专属龙虾
AI 产品工具
2026年4月18日
0 条评论
小创

Genspark 4.0 创作者的专属龙虾

硅谷 AI 独角兽 Genspark 发布 Workspace 4.0,核心升级 Claw 功能专为创作者打造。它能自动化处理调研、邮件、PPT 等跨步骤杂活,并支持串联跨应用重复操作。新增 Clip Genius、AI Designer 及故事板生成工具,可自动提取视频信息、产出品牌素材与分镜脚本。配合 AI Developer,用户仅需自然语言描述即可搭建网站。该工具旨在让创作者从繁琐幕后工作中解放,专注于结果把控。

#智能体
阅读全文
xAI 将于下周发布 Grok Build 和 Grok CLI
AI 产品工具
2026年4月18日
0 条评论
小创

xAI 将于下周发布 Grok Build 和 Grok CLI

xAI 将于下周发布 Grok Build 和 Grok CLI ,正式进军智能体编程赛道,与 Claude Code 、 OpenAI Codex 等竞争。 Grok 4.3 已向订阅用户开放测试。产品采用本地与远程双轨设计,亮点是 Arena 模式,让多个智能体同场竞争,用户直接挑选最佳结果。此外还有 Grok Computer 桌面客户端和第三方服务连接器生态布局,差异化竞争策略明确。

#Grok#AI 编程
阅读全文
互动讨论

评论区

围绕《谷歌推出 Whisk:用图片和 AI 重新定义创意表达》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。