超写实的人像同步模型：X-Portrait 2

X-Portrait 2 只需一张静态人像（含卡通图）和一段表情动作视频，即可高精度迁移细微表情与头部运动，保留原情感特征；支持快速运动建模与个性表达还原，显著降低虚拟主播、动画制作及数字人驱动门槛。

发布于2024年11月8日 11:29

编辑零重力瓦力

评论0 条

阅读63

#视频生成 #数字人

X-Portrait 2 是能够让静态照片"动起来"的技术。它的神奇之处在于：

你只需要准备两样东西：一张静态人像照片和一段表情动作视频
系统就能让照片里的人"模仿"视频中的表情和动作

主要优势

超强的表情迁移能力
能够精确捕捉并转移细微的面部表情变化
可以实现各种复杂表情，比如撅嘴、吐舌头、鼓腮帮、皱眉等
能够保持原视频中的情感特征

广泛的适用范围

X-Portrait 2 不光能处理真实人物照片，还能处理卡通图像
可用于讲故事、动画制作、虚拟主播、特效制作等多个领域

技术突破

比起其他类似技术，它能更好地处理快速的头部运动
可以准确转移非常细微的表情变化
能够保持个人特有的情感表达方式

应用场景

假设你有一张古代名人的照片，再配上一段现代人做表情的视频，这个技术就能让古人"活"起来，做出和现代人一样的表情动作。这种技术极大地简化了动画制作过程，把原本需要复杂动作捕捉设备才能完成的工作，变成了只需要一张照片和一段视频就能搞定的事情。

如何用 AI 零门槛复刻月入万刀的无人出镜频道

AI 博主 ADIL 演示利用 Claude Fable 5 配合 Higgsfield MCP 插件，在 20 分钟内全自动复刻高收益 YouTube 频道。该工作流集成图像、视频及语音生成引擎，可自动分析爆款结构、撰写脚本并一键产出含配音的纪录片视频及封面标签。平台并不排斥优质 AI 内容，此端到端自动化流程将创作耗时从数天缩至十几分钟，大幅降低不露脸创作门槛。未来核心竞争力在于利用工具实现规模化生产与持续运营的能力。

可灵 3.0 原生 4K：AI 视频终于跨过了影视工业的最后一道门槛

可灵 AI 发布 Video 3.0 原生 4K 模式，支持 3840×2160 分辨率、60fps 及 16bit HDR，首次在多维度达到广播级交付标准。该模式区别于后期放大，细节真实度显著提升，并新增多镜头分镜与原生音频生成功能，大幅提高制作效率。尽管 4K 生成成本较高，但其在 ELO 测试中排名第一，标志着 AI 视频从娱乐工具迈向影视工业级生产设施，解决了商业交付难题。

Runway AI 短片《50 Crowns》

由 Runway 制作的游戏 CG 级短片《50 Crowns》讲述了赛博格赏金猎人古堡探险的恐怖悬疑故事。该视频完成度极高，由创作者在不到一周内独立完成。相比以往需团队协作数月的复杂过场动画制作流程，AI 技术显著提升了包含复杂场景、角色对话及动作打斗内容的生产效率，展现了个人创作者实现高质量影视级内容的全新可能。

#Runway

阅读全文

互动讨论