能够融合声音的小型 TTS(文本转语音)模型:Kokoro

Kokoro 是仅 82M 参数的轻量级 TTS 模型,支持从十种预设声线中任选两种,按任意比例混合生成个性化语音——如男女声 60:40 融合。提供简洁 API,访问 kokorotts.com 即可快速调用。

发布于2025年1月17日 04:35
作者零重力瓦力
评论0
阅读0

一款新的文本转语音(TTS)模型 “Kokoro”,它只有 82M 参数!这个模型的强大之处在于,只需添加一行代码,就可以创建自定义声音,将任意两种声音(从十种预设中选择)按照任意比例进行混合。例如,你可以将一位男性和一位女性的声音以 60:40 的比例混合,生成一个独特的全新声音。

模型 API 调用方法:https://kokorotts.com

相关文章

互动讨论

评论区

围绕《能够融合声音的小型 TTS(文本转语音)模型:Kokoro》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。