Netflix 精准动作控制 AI 视频模型：Go-with-the-Flow AI

Netflix推出Go-with-the-Flow AI模型，仅通过替换高斯噪声为“变形噪声”微调基础视频模型，即实现动作迁移、镜头控制、“剪切拖拽”动画、转台运动引导及文本/图像驱动的3D一致视频生成，全程零计算增量，支持I2V与T2V双路径。

发布于2025年1月23日 06:56

编辑零重力瓦力

评论0 条

阅读77

#视频生成 #视频编辑

Netflix 推出了 Go-with-the-Flow 模型，一款能够灵活控制视频生成中运动模式的工具。它让用户可以自由决定场景中镜头和物体的运动方式，甚至还能将一个视频的运动模式“迁移”到另一个视频上。
为了实现这些功能，Netflix 的技术团队仅通过微调一个基础模型，无需改动原有的处理流程或模型架构。唯一的变化是，他们不再使用传统的高斯噪声（随机点点），而是引入了一种“变形噪声”。除此之外，模型的运行方式与基础模型完全一致，计算成本也丝毫未增加。

更有趣的是，这个模型还具备调节运动强度的功能！通过一种名为“噪声降解”的技术，用户在生成视频时可以灵活选择控制的力度。不仅如此，这项技术不仅支持图像转视频（I2V），还可以用于文本转视频（T2V），甚至能够仅凭运动信息生成高度逼真的 3D 场景。

1. 模型亮点

使用关键帧为物体制作动画
动作迁移
精确的镜头控制
“剪切与拖拽”动画
转台动画

2. 剪切与拖拽动画（I2V）

用户可以粗略地勾勒出一个物体轮廓，并将其用作动作引导。它会从第一帧开始，遵循拖拽的运动轨迹，生成一段自然平滑的视频。

3. 视频和编辑帧结合（I2V）

结合原始视频和一个编辑帧，模型能够无缝地将用户的编辑应用到整个视频中，同时保持所有内容与原始动作一致。

4. 转台镜头运动迁移

模型使用一个 3D 渲染的转台镜头对动作进行引导，并大幅超越了基础的 MotionClone 模型。它生成的场景具有更好的 3D 一致性，并且能够完美匹配镜头的运动。

5. Davis 动作迁移（T2V）

模型使用原始视频作为动作信号，并通过一个新的目标提示来引导输出。从而生成一个既符合目标提示又保持原始视频动作的视频。

6. 动作控制：WonderJourney（I2V）

基于单目深度估计（Monocular Depth Estimation，是一种计算机视觉技术，旨在通过单张二维图像推测场景中每个像素点到摄像机的距离，也就是估算图像中的深度信息。这项技术非常重要，因为普通的2D图像并不直接包含深度信息，而深度信息在3D重建、自动驾驶、增强现实等领域至关重要。）的图像转视频模型，将一张静态图像转化为一个一致的 3D 场景。

7. 重新光照与超级分辨率

通过不同的噪声变形和插值技术的应用。对比使用 DiffRelight 进行重新光照和使用 DeepFloyd Stage II 进行超级分辨率的效果。

项目地址：https://eyeline-research.github.io/Go-with-the-Flow

如何用 AI 零门槛复刻月入万刀的无人出镜频道

AI 博主 ADIL 演示利用 Claude Fable 5 配合 Higgsfield MCP 插件，在 20 分钟内全自动复刻高收益 YouTube 频道。该工作流集成图像、视频及语音生成引擎，可自动分析爆款结构、撰写脚本并一键产出含配音的纪录片视频及封面标签。平台并不排斥优质 AI 内容，此端到端自动化流程将创作耗时从数天缩至十几分钟，大幅降低不露脸创作门槛。未来核心竞争力在于利用工具实现规模化生产与持续运营的能力。

Google 为何要开发 Gemma 4 模型

谷歌推出开源模型 Gemma 4，旨在解决网络受限地区无法使用前沿 AI 的问题。该模型追求内存占用下的智能最大化，首次具备多模态与智能体能力，支持在无网移动端高效运行复杂任务。目前已在乌干达离线医疗系统及秘鲁原住民语言保护等场景中落地应用。通过将大模型蒸馏至终端设备，Gemma 4 摆脱了对云端算力的依赖，推动去中心化开源生态发展，赋能各社区按需构建专属系统。

微软 Mirage：让世界模型学会“过目不忘”，速度快 10 倍、显存省 55 倍

微软研究院联合多所高校发布 Mirage 模型，通过在扩散模型隐空间直接存储三维记忆，解决了 AI 视频生成中场景一致性差及计算昂贵的问题。该方案摒弃传统 RGB 点云渲染流程，使生成速度提升最高 10.57 倍，显存占用降低 55 倍，且长视频边际成本几乎不增。测试显示其三维与光度一致性优于现有方案，虽暂不支持动态物体记忆，但已开源并适用于机器人仿真等静态场景任务。

#世界模型

阅读全文

互动讨论

评论区

围绕《Netflix 精准动作控制 AI 视频模型：Go-with-the-Flow AI》展开交流，未登录用户可浏览评论，登录后可参与讨论。

评论数

登录后参与评论

支持发表观点与回复一级评论，互动后将同步到消息中心。

登录后评论

暂无评论，欢迎成为第一个参与讨论的人。

Netflix 精准动作控制 AI 视频模型：Go-with-the-Flow AI

1. 模型亮点

2. 剪切与拖拽动画（I2V）

3. 视频和编辑帧结合（I2V）

4. 转台镜头运动迁移

5. Davis 动作迁移（T2V）

6. 动作控制：WonderJourney（I2V）

7. 重新光照与超级分辨率

相关文章

如何用 AI 零门槛复刻月入万刀的无人出镜频道

Google 为何要开发 Gemma 4 模型

微软 Mirage：让世界模型学会“过目不忘”，速度快 10 倍、显存省 55 倍

评论区