手势同步开源模型:TANGO

TANGO是东京大学与CyberAgent AI联合推出的开源手势同步模型,可将人物视频中的手势动作与任意音频精准对齐,补足了现有口型同步技术在肢体协同上的空白,适合虚拟人、动画制作及交互式AI应用。

发布于2024年10月14日 10:30
作者零重力瓦力
评论0
阅读0

目前已经有了不少出色的口型同步模型,这款由东京大学和 CyberAgent AI 合作开发的开源模型:TANGO,专门用来解决人物对话和手势的同步。使用时需提供一段包含人物手势的视频,再提供一段音频。TANGO 能够将视频中人物的手势和语音完美同步。

TANGO 项目地址 TANGO 试用地址 TANGO 论文

相关文章

互动讨论

评论区

围绕《手势同步开源模型:TANGO》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。