如何实现 AI 文生视频的人物一致性

海螺AI提出文生视频人物一致性提示词公式:头发+年龄与性别+服装颜色+环境+动作/镜头等,通过强化非面部视觉特征、限定年龄与光照环境提升角色稳定性;实测显示同角色在不同时段生成的多镜头中面部特征保持较强一致性。

发布于2024年9月13日 02:19
编辑零重力瓦力
评论0
阅读40

在 AI 绘画中,我们可以通过 LoRA 和 Midjourney 的角色参考(--cref)实现人物的一致性。然而,在 AI 视频领域,尤其是文本生成视频方面,保持人物一致性一直被认为是一个不可能完成的任务。然而,海螺 AI 提出了一种实现视频人物一致性的提示词公式。

公式

Hair + Age & Gender + Color of the clothes + Environment + Other (Action, Camera, etc.)

头发 + 年龄 + 性别 + 服装的颜色 + 环境 + 其他(动作,镜头……)

  • 头发 / 服装:尽可能多地构建角色的非面部视觉元素,从而为观众创造“统一的外观”。
  • 年龄:限制角色的年龄跨度。
  • 环境:限制环境空间,特别是光照环境,以产生相同的感知,从而增强观众对画面的一致性感受。

示例

镜头一

Close-up of a little Chinese boy with black hair and wearing a white T-shirt, facing the camera, his face illuminated by candlelight, his expression of surprise, the environment is dim and the contrast between light and dark is strong
一个黑发、白T恤的中国小男孩的特写,面对镜头,他的脸被烛光照亮,他惊讶的表情,环境昏暗,明暗对比强烈

镜头二

Close-up of a little Chinese boy with black hair and wearing a white T-shirt, facing the camera sideways, slightly tilting his head as he walks through a dark green forest, his face illuminated by an oil lamp in his hand, the environment is dim and the contrast between light and dark is strong.
一个黑发、白T恤的中国小男孩的特写,侧身面对镜头,微微歪着头,走在深绿色的森林里,他的脸被手里的油灯照亮,环境昏暗,明暗对比强烈。

镜头三

Side shot of a little Chinese boy with black hair and wearing a white T-shirt, looking at a candle on a table in front of him, the environment is dark and the contrast is strong
一个黑发、白T恤的中国小男孩的侧影,看着面前桌子上的蜡烛,环境黑暗,对比强烈

镜头四

Medium shot of a little Chinese boy with black hair and wearing a white T-shirt, facing the camera, in a dreamy, warm-toned room, concentrating fully on assembling the building blocks in front of him.
中景镜头,一个黑发、白T恤的中国小男孩,面对镜头,在一个梦幻般的暖色调房间里,全神贯注地组装面前的积木。

以上四组镜头的生成时间间隔大约5分钟。

镜头五

这个镜头与第一个镜头使用了完全相同的提示词,尽管生成时间间隔了12小时,人物仍具备较强的一致性。从这组测试来看,只要设定相同的年龄、性别和发型,海螺 AI 生成的人物在面部特征上表现出相对的稳定性。对于其他年龄、种族和性别的人物一致性还有待进一步测试,也期待大家的反馈。

相关文章

OpenAI 学院:提示工程基础
提示词工程
2026年4月16日
0 条评论
小创

OpenAI 学院:提示工程基础

提示词工程是设计和优化 AI 输入指令的核心技能,关键在于明确任务目标、提供背景信息并描述期望输出形式。随着指令精细化程度提升, AI 回答质量显著改善。面对复杂问题时采用分步提问、在具体性与简洁性间寻求平衡可获得更精准的回复。本质上这是一种精准表达的修炼,体现了与 AI 协作的迭代优化过程。

#OpenAI#提示词工程
阅读全文
一文了解 Google Chrome 的 AI 驱动‘Skills’功能
AI 新闻资讯
2026年4月15日
0 条评论
小创

一文了解 Google Chrome 的 AI 驱动‘Skills’功能

Google Chrome 推出“Skills”功能,提供 50 余个 AI 指令模板,支持视频总结、食谱优化等场景,并通过快捷键实现可重复执行。该功能标志着浏览器从问答工具向“操作型代理”转型,降低用户操作成本,提升工作流效率。用户亦可基于 Gemini 创建自定义 Skills ,形成个性化 AI 工作流。

#Google#Gemini#提示词工程
阅读全文
在 Google Vids 免费创建、编辑和分享视频
AI 产品工具
2026年4月11日
0 条评论
小创

在 Google Vids 免费创建、编辑和分享视频

Google Vids 全面升级 AI 能力,引入 Veo 3.1 和 Lyria 3 模型。所有用户现可免费每月生成 10 个视频片段, Pro 和 Ultra 订阅者可生成自定义配乐并使用支持场景化编排的 AI 智能体。 Chrome 扩展和 YouTube 直传通道进一步提升效率。订阅层级差异化明显, Ultra 用户月配额达 1000 条。升级标志着 Google 正将 Vids 打造为企业级 AI 视频生产入口。

#Google#视频生成
阅读全文
互动讨论

评论区

围绕《如何实现 AI 文生视频的人物一致性》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。