字节跳动开源口型同步模型：LatentSync

2025-01-06 AI 工具文章 0 0 98 0

继 Loopy 之后，字节又发布了一款开源口型同步模型：LatentSync。效果丝毫不逊色于阿里的 EMO，微软的 Vasa-1。

模型亮点

1. 能够一步到位，直接将声音转换成匹配的嘴型画面。
2. 借助 Stable Diffusion 的 AI 绘画技术让视频的画面更加自然。
3. LatentSync 开发了一个叫 TREPA 的新技术，能够让连续的画面更流畅，不会出现不自然的跳变。

模型演示

口型同步字节跳动

评论(0)

提示：请文明发言取消回复