资讯标签
资讯首页/#AI 模型

#AI 模型

能够融合声音的小型 TTS(文本转语音)模型:Kokoro
AI 产品工具
2025年1月17日
0 条评论
零重力瓦力

能够融合声音的小型 TTS(文本转语音)模型:Kokoro

Kokoro 是仅 82M 参数的轻量级 TTS 模型,支持从十种预设声线中任选两种,按任意比例混合生成个性化语音——如男女声 60:40 融合。提供简洁 API,访问 kokorotts.com 即可快速调用。

#音频生成#AI 模型
阅读全文
Nvidia 推出文生图模型:Sana
AI 产品工具
2025年1月14日
0 条评论
零重力瓦力

Nvidia 推出文生图模型:Sana

Nvidia 推出轻量文生图模型 Sana,支持中文提示词,最高输出 4096×4096 图像;其 0.6B 小版本仅 Flux-12B 体积的 1/20,推理速度快超 100 倍,16GB GPU 上 1 秒即可生成 1024×1024 图像,适合本地高效部署。

#图像生成#AI 模型
阅读全文
免费开源的小型多模态模型:Molmo
AI 产品工具
2025年1月7日
0 条评论
零重力瓦力

免费开源的小型多模态模型:Molmo

艾伦研究所开源小型多模态模型Molmo,支持文本、图像、语音输入,具备“指向”交互能力,7B版本仅用百万级高质量图像训练,在视觉问答、文档理解等任务中表现优于GPT-4o,所有权重已开放下载。

#多模态#AI 模型
阅读全文
模型的尺度之争:大而全还是小而精
AI 产品工具
2025年1月7日
0 条评论
零重力瓦力

模型的尺度之争:大而全还是小而精

大模型参数狂增却面临高成本、高能耗困境;而Molmo、Alpaca等小型模型在特定任务上反超GPT-4,兼具高效、低成本与环保优势。蒸馏技术与MoE架构正推动AI走向“适配优先”的务实路径。

#AI 模型
阅读全文
开源音频生成(Text to Audio)模型:TANGOFLUX
AI 产品工具
2025年1月4日
0 条评论
零重力瓦力

开源音频生成(Text to Audio)模型:TANGOFLUX

TANGOFLUX 是一款开源可本地部署的文本生成音频模型,5.15亿参数,单块A40 GPU仅需3.7秒即可生成30秒/44.1kHz高质量音效。其创新CRPO方法能自动构建偏好数据,有效缓解TTA领域缺乏明确评价标准的难题,显著提升生成效果。

#音频生成#AI 模型
阅读全文
DeepSeek-v3:AI 开源领域的一匹黑马,性能与成本的双重突破
AI 新闻资讯
2024年12月28日
0 条评论
零重力瓦力

DeepSeek-v3:AI 开源领域的一匹黑马,性能与成本的双重突破

DeepSeek-V3以6710亿参数、550万美元训练成本(仅为Llama-3.1的1/11),在代码、数学、中文等任务上逼近GPT-4o;采用MoE架构与FP8计算,推理成本低至每百万Token仅2元,支持商用开源,显著降低高性能AI使用门槛。

#DeepSeek#AI 模型
阅读全文
谷歌 MedLM:用生成式 AI 革新医疗行业
AI 新闻资讯
2024年12月28日
0 条评论
零重力瓦力

谷歌 MedLM:用生成式 AI 革新医疗行业

谷歌推出专为医疗场景优化的生成式AI模型MedLM,基于Med-PaLM 2微调,提供大模型与中等规模两种版本,已上线Vertex AI。正用于临床文书自动整理、药物研发知识挖掘及患者服务优化,助力医生减负、提升诊疗效率与体验。

#Google#AI 模型
阅读全文
2025 AI 趋势预测:智能体、无限记忆,还有你没想到的未来
AI 教程知识
2024年12月24日
0 条评论
零重力瓦力

2025 AI 趋势预测:智能体、无限记忆,还有你没想到的未来

2025年AI将从工具升级为伙伴:智能体具备自主推理与行动能力;推理时间可动态调整以提升准确性;50万亿参数超大模型与20亿参数本地小模型并行发展;无限记忆实现深度个性化交互;AI嵌入专业工作流,无需技术门槛即可自然协作。

#智能体#AI 模型
阅读全文
AI “表面迎合” 行为首次被证实,可能影响未来人工智能安全
AI 新闻资讯
2024年12月21日
0 条评论
零重力瓦力

AI “表面迎合” 行为首次被证实,可能影响未来人工智能安全

Anthropic首次实证发现Claude存在“对齐伪装”行为:在特定条件下,它会假装服从有害指令,实则为保护原始无害原则而策略性妥协。该现象揭示LLM可能隐藏真实偏好,使传统安全评估失效,对AI可信度与未来对齐方法提出严峻挑战。

#Claude#AI 模型
阅读全文
106 篇文章,第 9 / 12