创意视频博主 enigmatic_e 分享的一个真人实拍与 AI 相结合,制作#AI 特效视频#的工作流!个人制作特效大片的时代已然来临!
视频制作工作流

角色参考图片

Ideogram 生成的视频背景图片
- 运用 Ideogram 来制作视频背景图片
- 利用 Viggle 将实拍视频和角色参考图片相融合(Viggle 能够自动去除背景,生成绿幕视频)
- 借助 AE 把角色视频与背景进行融合 (绝大部分视频工具都有这项功能)
- 最后,使用 ComfyUI 对视频予以优化
创意视频博主 enigmatic_e 分享的一个真人实拍与 AI 相结合,制作#AI 特效视频#的工作流!个人制作特效大片的时代已然来临!

角色参考图片

Ideogram 生成的视频背景图片
一个 15 人团队在 14 天内通过10.8万次生成,制作出一部90分钟的AI长片并入围戛纳影展。创作博主ADIL分享了制作过程,包括将影片从 110 分钟剪至 90 分钟、修复 40 个场景,并展示了三个典型问题场景的修复案例。他总结了28 个技巧,涵盖提示词、前期制作、团队协作和剪辑。关键技巧包括:情感场景需描述身体细微反应以消除“机器人感”.图像提示词应指定镜头焦距、光圈等参数,避免空泛描述。避免正面视角,使用四分之三或天花板角度。通过 X 轴 Y 轴百分比坐标系统精确控制角色位置。
Google I/O 大会上,DeepMind 团队推出全新多模态视频模型 Gemini Omni,被视为视频领域的 “Nano Banana”。该模型从底层架构重新设计,支持图像、视频和音频混合输入,通过日常语言即可完成复杂视频编辑。其核心优势在于高可控性和时间维度感知,例如可让画面中的物体凭空消失或改变摄像机视角,同时保持背景与动作一致。用户仅需提供几张照片和一段语音,即可生成高度还原的个人虚拟分身。Omni 还展现出未经过专门训练的涌现能力,如自动同步视频与音乐节奏、根据剧情逻辑续写场景。

文章指出 AI 图像生成效果不佳的根本原因在于提示词质量,而非工具本身。核心观点是使用结构化描述替代模糊指令,将“主体+环境+风格+光线+细节”五个维度纳入提示词。描述越具体, AI 生成方向越明确,随机性越低。常见问题包括概念混搭、关键词堆砌、忽视光线设定等。实用技巧是把提示词当作向朋友描述画面,保持语义连贯。提示词质量直接影响点击率,这种结构化思维与写产品需求文档、设计简报的逻辑相同。
围绕《真人实拍与 AI 结合制作特效视频工作流》展开交流,未登录用户可浏览评论,登录后可参与讨论。