字节跳动推出了一款极为出色的多模态 AI 人像视频生成模型,能够基于单张人物图像和运动信号(如音频、视频,以及两者结合)生成人物视频。通过引入多模态运动条件混合训练策略,这款模型克服了高质量数据稀缺的问题,在弱信号输入(特别是音频)下依然能够生成高度逼真的人类视频。它支持任意纵横比的输入图像,包括人像、半身和全身,展现出细腻的运动、光照和纹理细节。OmniHuman 在唱歌、讲话等场景中表现十分出色,支持多种姿势、风格以及复杂动作,适配卡通、人工物体及动物等多样化输入。同时,它兼容音频驱动、视频驱动以及两者的结合,通过混合条件训练实现对特定身体部位的精准控制!
相关文章
AI 产品工具
2026年4月1日
0 条评论
零重力瓦力
【AI教程】四个开源项目,让你的 AI 化身整个公司
拆成可复用角色;hermes-agent 主打任务后自动沉淀技能、让智能体越用越聪明;Superpowers 以测试驱动流程串起开发全链路;Paperclip 则尝试用多智能体编排“零人工公司”。
#智能体#开源项目
阅读全文
AI 产品工具
2026年3月26日
0 条评论
零重力瓦力
【AI工具】Adobe Firefly 推出自定义图像模型功能
Adobe Firefly上线自定义图像模型功能,用户上传10张以上图片即可训练专属艺术风格模型,聚焦AI美学方向;但该能力比Midjourney晚半年推出,AI视频部分未采用自研模型,转而接入可灵2.6,引发对其技术节奏与生态策略的质疑。
#图像生成#可灵
阅读全文
AI 视频影视
2026年3月26日
0 条评论
零重力瓦力
AI 科幻系列短篇《零号竞技场》(Arena Zero)
AI科幻短篇《零号竞技场》(Arena Zero)全程由AI生成,仅用4天完成制作,画面质感与叙事节奏达到好莱坞科幻短片水准,刷新AI内容创作的效率与质量边界。
#视频生成
阅读全文
互动讨论
评论区
围绕《字节跳动推出新一代人像 AI 视频生成模型:OmniHuman-1》展开交流,未登录用户可浏览评论,登录后可参与讨论。
评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
暂无评论,欢迎成为第一个参与讨论的人。