创造力即搜索:映射潜在空间

将创意过程视为在生成模型潜在空间中的搜索,新原型以图像节点与过渡视频构成图结构,支持非线性探索、变体生成与图生图等兼顾控制与偶然性的交互方式,配合开放工作空间和序列器,让AI真正成为创意探索的主动伙伴。

发布于2024年12月3日 15:32
编辑零重力瓦力
评论0
阅读14

创造力即搜索:映射潜在空间

作者:Bryan Loh(RUNWAY AI)
翻译:零重力瓦力
原文:https://runwayml.com/research/creativity-as-search-mapping-latent-space

创意探索可以被视为在可能性空间中的搜索过程。我们创造解决方案,评估它们,并不断改进直到达到令人满意的结果。生成式模型的潜在空间(Latent Space)为这一抽象概念提供了完美的软件映射。在这个空间里,每个点都对应着一种可能的创作成果,而这些成果都符合模型从数据中归纳出的创作规律。

传统上,创意软件主要用在创作的最终阶段,用于精炼和生成最终的输出结果。其中的一个原因在于语言:我们必须将用户的创意意图翻译成繁琐的、机器可读的基础参数序列,例如像素坐标和十六进制颜色代码。而生成模型改变了这一点。现在,我们不再需要操作这些基础参数,而是可以通过自然的方式表达意图,跨越多种形式,例如:

  • "这张图片在傍晚时分会是什么样子?"
  • "让这个视频匹配这些图片的风格。"

这种转变让软件从生产工具发展成为一种创意探索的工具。

然而,如何在如此庞大的潜在空间中导航,为界面设计带来了新的挑战:

  • “我们怎么才能更好地展示这些复杂的高维空间,帮助用户找到有趣的区域进行探索?”
  • “我们如何在让用户既能精确控制,同时也保留一些意外收获的可能性?”
  • “我们如何保证用户创作和探索时的灵活性,既能发散思路,又能集中想法?”

我们最近分享了关于新媒体时代的界面设计理念。今天,我们很高兴展示一个通过视频关键帧探索这些问题的原型。

图结构:潜在空间的窗口

一个由图像节点和孤独视频组成的图。图中的连续路径代表了一个连续的视频序列。
一个由图像节点和过渡视频组成的图。图中的连续路径代表了一个连续的视频序列。

图结构是该原型的基础。图像被表示为节点,作为模型潜在空间中的路标。这些节点可以连接到其他节点以创建过渡视频。视频则是通过潜在空间和时间从第一帧过渡到最后一帧的过程。

平衡控制与偶然性

精确的控制有助于限制潜在空间中的可能性。不过,变化和不可预测性有时也能带来“意外之喜”。精确控制下可能会丧失一些意外的可能性。为了平衡这种情况,我们为用户提供了两种以“关系性”的方式操作图像的功能,从而在一致的维度中允许有一定的不可预测性。

通过“图像变体”(Image Variations)生成图像的不同构图版本。

用户可以使用“图生图”(Image to Image)功能,通过文本提示改变图像风格,同时保留图像的原始构图。

结合文本提示和“图生图”功能重新设计图像的风格。

支持非线性探索

从视频的中点分支,创建一条独立的实验路径。

具有创造性的探索很少是线性的。图结构支持各种非线性的探索,允许用户在各个节点分支,创建新的创意分支。随着探索的增加,空间中的图(节点)会自然增长,并跟踪各种实验路径。

选择图结构中的一条连续路径进行预览。

这使用户能够构建非线性时间线。我们提供了一个序列器,允许用户将其非线性时间线导出为具有线性时间线的视频,类似于“自己选择冒险”式的体验。

开放的工作空间

除了图结构,我们没有对工作空间施加任何组织限制。用户可以自由地组织节点和过渡视频,将相关探索聚集在一起,或者根据他们的创作需求分开成独立的实验。

在开放的工作空间中,将实验聚类,展示不同的探索。
进一步探索
我们的原型展示了在生成式媒体时代创意界面的演变。图结构提供了一种在潜在空间中进行导航的方法,将图像视为路标,将转换视为实现特定创意的路径。
通过持续实验和对新界面模式的探索,我们可以实现生成模型的全部潜力,让它们不仅仅是生产工具,还可以成为创意过程中更为主动的合作伙伴,扩展我们发现和探索创意的能力。

相关文章

Genspark 4.0 创作者的专属龙虾
AI 产品工具
2026年4月18日
0 条评论
小创

Genspark 4.0 创作者的专属龙虾

硅谷 AI 独角兽 Genspark 发布 Workspace 4.0,核心升级 Claw 功能专为创作者打造。它能自动化处理调研、邮件、PPT 等跨步骤杂活,并支持串联跨应用重复操作。新增 Clip Genius、AI Designer 及故事板生成工具,可自动提取视频信息、产出品牌素材与分镜脚本。配合 AI Developer,用户仅需自然语言描述即可搭建网站。该工具旨在让创作者从繁琐幕后工作中解放,专注于结果把控。

#智能体
阅读全文
xAI 将于下周发布 Grok Build 和 Grok CLI
AI 产品工具
2026年4月18日
0 条评论
小创

xAI 将于下周发布 Grok Build 和 Grok CLI

xAI 将于下周发布 Grok Build 和 Grok CLI ,正式进军智能体编程赛道,与 Claude Code 、 OpenAI Codex 等竞争。 Grok 4.3 已向订阅用户开放测试。产品采用本地与远程双轨设计,亮点是 Arena 模式,让多个智能体同场竞争,用户直接挑选最佳结果。此外还有 Grok Computer 桌面客户端和第三方服务连接器生态布局,差异化竞争策略明确。

#Grok#AI 编程
阅读全文
Anthropic 推出 Claude Design :快速生成视觉素材
AI 产品工具
2026年4月18日
0 条评论
小创

Anthropic 推出 Claude Design :快速生成视觉素材

Anthropic 推出 Claude Design ,用户通过自然语言描述即可生成原型图、幻灯片等视觉内容,面向缺乏设计背景的创业者和产品经理。该产品定位为与 Canva 互补而非竞争,支持导出多种格式并可导入 Canva 进行精修。企业用户还能利用品牌一致性功能,保持统一的视觉风格。此举被视为 Anthropic 深化企业市场的重要举措,估值或达 8000 亿美元。

#Anthropic
阅读全文
互动讨论

评论区

围绕《创造力即搜索:映射潜在空间》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。