继 Loopy 之后,字节又发布了一款开源口型同步模型:LatentSync。效果丝毫不逊色于阿里的 EMO,微软的 Vasa-1。
模型亮点
1. 能够一步到位,直接将声音转换成匹配的嘴型画面。
2. 借助 Stable Diffusion 的 AI 绘画技术让视频的画面更加自然。
3. LatentSync 开发了一个叫 TREPA 的新技术,能够让连续的画面更流畅,不会出现不自然的跳变。
继 Loopy 之后,字节又发布了一款开源口型同步模型:LatentSync。效果丝毫不逊色于阿里的 EMO,微软的 Vasa-1。
1. 能够一步到位,直接将声音转换成匹配的嘴型画面。
2. 借助 Stable Diffusion 的 AI 绘画技术让视频的画面更加自然。
3. LatentSync 开发了一个叫 TREPA 的新技术,能够让连续的画面更流畅,不会出现不自然的跳变。
评论(0)