如何实现 AI 文生视频的人物一致性

海螺AI提出文生视频人物一致性提示词公式：头发+年龄与性别+服装颜色+环境+动作/镜头等，通过强化非面部视觉特征、限定年龄与光照环境提升角色稳定性；实测显示同角色在不同时段生成的多镜头中面部特征保持较强一致性。

发布于2024年9月13日 02:19

编辑零重力瓦力

评论0 条

阅读259

在 AI 绘画中，我们可以通过 LoRA 和 Midjourney 的角色参考（--cref）实现人物的一致性。然而，在 AI 视频领域，尤其是文本生成视频方面，保持人物一致性一直被认为是一个不可能完成的任务。然而，海螺 AI 提出了一种实现视频人物一致性的提示词公式。

公式

Hair + Age & Gender + Color of the clothes + Environment + Other (Action, Camera, etc.)

头发 + 年龄 + 性别 + 服装的颜色 + 环境 + 其他（动作，镜头……）

头发 / 服装：尽可能多地构建角色的非面部视觉元素，从而为观众创造“统一的外观”。
年龄：限制角色的年龄跨度。
环境：限制环境空间，特别是光照环境，以产生相同的感知，从而增强观众对画面的一致性感受。

示例

镜头一

Close-up of a little Chinese boy with black hair and wearing a white T-shirt, facing the camera, his face illuminated by candlelight, his expression of surprise, the environment is dim and the contrast between light and dark is strong

一个黑发、白T恤的中国小男孩的特写，面对镜头，他的脸被烛光照亮，他惊讶的表情，环境昏暗，明暗对比强烈

镜头二

Close-up of a little Chinese boy with black hair and wearing a white T-shirt, facing the camera sideways, slightly tilting his head as he walks through a dark green forest, his face illuminated by an oil lamp in his hand, the environment is dim and the contrast between light and dark is strong.

一个黑发、白T恤的中国小男孩的特写，侧身面对镜头，微微歪着头，走在深绿色的森林里，他的脸被手里的油灯照亮，环境昏暗，明暗对比强烈。

镜头三

Side shot of a little Chinese boy with black hair and wearing a white T-shirt, looking at a candle on a table in front of him, the environment is dark and the contrast is strong

一个黑发、白T恤的中国小男孩的侧影，看着面前桌子上的蜡烛，环境黑暗，对比强烈

镜头四

Medium shot of a little Chinese boy with black hair and wearing a white T-shirt, facing the camera, in a dreamy, warm-toned room, concentrating fully on assembling the building blocks in front of him.

中景镜头，一个黑发、白T恤的中国小男孩，面对镜头，在一个梦幻般的暖色调房间里，全神贯注地组装面前的积木。

以上四组镜头的生成时间间隔大约5分钟。

镜头五

这个镜头与第一个镜头使用了完全相同的提示词，尽管生成时间间隔了12小时，人物仍具备较强的一致性。从这组测试来看，只要设定相同的年龄、性别和发型，海螺 AI 生成的人物在面部特征上表现出相对的稳定性。对于其他年龄、种族和性别的人物一致性还有待进一步测试，也期待大家的反馈。

Ploy 从 Claude Opus 4.8 迁移到 GPT-5.6 完整实录

Ploy 公司将 AI agent 从 Claude Opus 4.8 迁移至 GPT-5.6 Sol 后，构建耗时缩短过半且成本降低，但过程中遭遇三大工程挑战。一是评测框架适配旧模型导致误判；二是新模型填充冗余参数引发工具调用异常，需通过 schema 变换解决；三是缓存机制差异致命中率归零，需重构 key 策略。这表明生产环境模型迁移并非简单替换，需针对调用习惯与基础设施进行深度工程适配。

#智能体工程#ChatGPT#Claude

如何用 AI 零门槛复刻月入万刀的无人出镜频道

AI 博主 ADIL 演示利用 Claude Fable 5 配合 Higgsfield MCP 插件，在 20 分钟内全自动复刻高收益 YouTube 频道。该工作流集成图像、视频及语音生成引擎，可自动分析爆款结构、撰写脚本并一键产出含配音的纪录片视频及封面标签。平台并不排斥优质 AI 内容，此端到端自动化流程将创作耗时从数天缩至十几分钟，大幅降低不露脸创作门槛。未来核心竞争力在于利用工具实现规模化生产与持续运营的能力。

AI 工程的 4 步进化：每一步都站在上一步肩上

AI 工程化演进并非替代而是叠加，包含四个关键维度：Prompt engineering 解决单次输出准确性；Context engineering 通过 RAG 等技术优化信息输入；Harness 赋予模型工具与环境以具备行动能力；Loop 则通过迭代验证提升多步执行稳定性。这四个阶段分别对应模型的表达、记忆、手脚与工程纪律，缺一不可。成熟的 AI 产品需同时整合这四层能力，当前行业仍在探索如何平衡 Loop 的自动化与人工验证机制。

#智能体工程#提示词工程#上下文工程

阅读全文

互动讨论

评论区

围绕《如何实现 AI 文生视频的人物一致性》展开交流，未登录用户可浏览评论，登录后可参与讨论。

评论数

登录后参与评论

支持发表观点与回复一级评论，互动后将同步到消息中心。

登录后评论

暂无评论，欢迎成为第一个参与讨论的人。

如何实现 AI 文生视频的人物一致性

公式

示例

镜头一

镜头二

镜头三

镜头四

镜头五

相关文章

Ploy 从 Claude Opus 4.8 迁移到 GPT-5.6 完整实录

如何用 AI 零门槛复刻月入万刀的无人出镜频道

AI 工程的 4 步进化：每一步都站在上一步肩上

评论区