一款新的文本转语音(TTS)模型 “Kokoro”,它只有 82M 参数!这个模型的强大之处在于,只需添加一行代码,就可以创建自定义声音,将任意两种声音(从十种预设中选择)按照任意比例进行混合。例如,你可以将一位男性和一位女性的声音以 60:40 的比例混合,生成一个独特的全新声音。
模型 API 调用方法:https://kokorotts.com
一款新的文本转语音(TTS)模型 “Kokoro”,它只有 82M 参数!这个模型的强大之处在于,只需添加一行代码,就可以创建自定义声音,将任意两种声音(从十种预设中选择)按照任意比例进行混合。例如,你可以将一位男性和一位女性的声音以 60:40 的比例混合,生成一个独特的全新声音。
模型 API 调用方法:https://kokorotts.com
硅谷 AI 独角兽 Genspark 发布 Workspace 4.0,核心升级 Claw 功能专为创作者打造。它能自动化处理调研、邮件、PPT 等跨步骤杂活,并支持串联跨应用重复操作。新增 Clip Genius、AI Designer 及故事板生成工具,可自动提取视频信息、产出品牌素材与分镜脚本。配合 AI Developer,用户仅需自然语言描述即可搭建网站。该工具旨在让创作者从繁琐幕后工作中解放,专注于结果把控。

xAI 将于下周发布 Grok Build 和 Grok CLI ,正式进军智能体编程赛道,与 Claude Code 、 OpenAI Codex 等竞争。 Grok 4.3 已向订阅用户开放测试。产品采用本地与远程双轨设计,亮点是 Arena 模式,让多个智能体同场竞争,用户直接挑选最佳结果。此外还有 Grok Computer 桌面客户端和第三方服务连接器生态布局,差异化竞争策略明确。

Anthropic 推出 Claude Design ,用户通过自然语言描述即可生成原型图、幻灯片等视觉内容,面向缺乏设计背景的创业者和产品经理。该产品定位为与 Canva 互补而非竞争,支持导出多种格式并可导入 Canva 进行精修。企业用户还能利用品牌一致性功能,保持统一的视觉风格。此举被视为 Anthropic 深化企业市场的重要举措,估值或达 8000 亿美元。
围绕《能够融合声音的小型 TTS(文本转语音)模型:Kokoro》展开交流,未登录用户可浏览评论,登录后可参与讨论。