ElevenLabs 发布 Dubbing v2 配音模型。以前做 AI 配音基本都要先转成文字,翻译后再生成新的语音,很难保留原声的情绪和节奏。Dubbing v2 直接基于原声进行条件生成,跳过了文本中转这一步。这就意味着原视频里的语气、停顿甚至情绪起伏都能完整保留到 90 多种新的语言里。
它还有个同步感知翻译机制,能自动调整不同语言的措辞长度,让配音的起止时间跟原片直接对齐。做视频出海或者多语言广告的朋友应该懂,以前光是调时间轴就能把人折腾疯,现在这部分工作基本可以全自动化了。
专业影视级配音的成本通常按分钟算,价格不菲。这个模型把门槛拉低到了普通创作者也能用的程度。大家可以直接去 ElevenCreative 试试水。