如何让 AI 制作的人物对话表现的自然

AI创作者MetaPuppet为提升可灵v1.5人物对话自然度,摸索出一套实用流程:先确保人脸稳定、光线充足;再将对话分段为5秒片段做口型同步;用Runway超慢动作(0.5倍速)插帧增帧率,最后在Pr中2倍速还原并精准对齐原音频,显著改善流畅度与真实感。

发布于2024年11月5日 05:30
编辑零重力瓦力
评论0
阅读69

AI 视频创作者 MetaPuppet 想要通过可灵 v1.5 为自己的影片《记忆碎片》制作人物对话的场景。经过实践,他发现可灵 v1.5 生成的视频虽然很逼真但仍旧不够自然。经过一番尝试,他总结了一个让人物对话表现得更加自然的视频制作流程。

详细步骤

在进行口型同步前,确保角色脸部一直在画面当中,且光线良好,否则口型同步可能会失败。将画面调整到令你满意后,点击视频下方的"口型同步"按钮。

可灵一次只能生成 5 秒的口型同步视频,因此需要事先将对话内容切割成5秒的视频片段。

可灵的口型同步使用非常简单,但生成的视频往往不够流畅,那是因为生成视频的帧速率低于原始视频。

这个时候,可以通过 Runway 解决这个问题。将可灵生成的视频上传至 Runway,然后点击 Super-Slow Motion(超慢动作)按钮,把速度设置成 0.5。新的视频将变成半速,此时 Runway 为原视频添加了更多的中间帧。

以最高分辨率导出视频,并包含音频。

把新的视频导入 Pr,把视频播放速度调整成2倍速,并通过音频波形图,将原音频与新的视频对齐。

完成对齐后,删除视频中被加速的音频。新的视频与原视频长度一致,但因为加入了新的中间帧,效果变得更加自然了。

相关文章

10 分钟搞定整套设计,AI 工作流的终极闭环
AI 教程知识
2026年5月28日
0 条评论
小创

10 分钟搞定整套设计,AI 工作流的终极闭环

AI 设计智能体 Lovart 搭配 GPT Image 2 引擎,有效解决了 AI 营销素材风格不统一的痛点。该工具通过多轮追问明确需求后并行生成素材,确保品牌视觉高度一致。其支持可编辑图层修改及无限画布内静态图转视频,无需跨工具操作。相比传统流程,制作包含 7 个素材的广告活动耗时从近 3 小时缩短至 10 分钟,显著提升设计效率与工作流闭环能力。

#AI 绘画
阅读全文
14 天 50 万美元,AI 长片杀进戛纳的 28 个实战技巧
AI 教程知识
2026年5月22日
0 条评论
小创

14 天 50 万美元,AI 长片杀进戛纳的 28 个实战技巧

一个 15 人团队在 14 天内通过10.8万次生成,制作出一部90分钟的AI长片并入围戛纳影展。创作博主ADIL分享了制作过程,包括将影片从 110 分钟剪至 90 分钟、修复 40 个场景,并展示了三个典型问题场景的修复案例。他总结了28 个技巧,涵盖提示词、前期制作、团队协作和剪辑。关键技巧包括:情感场景需描述身体细微反应以消除“机器人感”.图像提示词应指定镜头焦距、光圈等参数,避免空泛描述。避免正面视角,使用四分之三或天花板角度。通过 X 轴 Y 轴百分比坐标系统精确控制角色位置。

#Higgsfield#视频生成
阅读全文
谷歌发布全新视频模型 Gemini Omni,视频编辑迎来质变
AI 新闻资讯
2026年5月22日
0 条评论
小创

谷歌发布全新视频模型 Gemini Omni,视频编辑迎来质变

Google I/O 大会上,DeepMind 团队推出全新多模态视频模型 Gemini Omni,被视为视频领域的 “Nano Banana”。该模型从底层架构重新设计,支持图像、视频和音频混合输入,通过日常语言即可完成复杂视频编辑。其核心优势在于高可控性和时间维度感知,例如可让画面中的物体凭空消失或改变摄像机视角,同时保持背景与动作一致。用户仅需提供几张照片和一段语音,即可生成高度还原的个人虚拟分身。Omni 还展现出未经过专门训练的涌现能力,如自动同步视频与音乐节奏、根据剧情逻辑续写场景。

#Gemini#视频编辑#视频生成
阅读全文
互动讨论

评论区

围绕《如何让 AI 制作的人物对话表现的自然》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。