资讯标签
资讯首页/#AI 模型

#AI 模型

RAG 和 模型微调哪个好,怎么用?
AI 教程知识
2025年2月16日
0 条评论
零重力瓦力

RAG 和 模型微调哪个好,怎么用?

RAG借助外部向量库实时检索信息,成本低、易更新,适合需动态数据的场景;模型微调则通过领域数据训练提升专业性与准确性,但耗资源且知识静态。二者并非互斥,常结合使用——RAG补时效,微调强专精。

#RAG#AI 模型#New Machina
阅读全文
Magic 1-For-1:一分钟生成高质量视频,速度快到超乎想象
AI 产品工具
2025年2月13日
0 条评论
零重力瓦力

Magic 1-For-1:一分钟生成高质量视频,速度快到超乎想象

Magic 1-For-1 是一款开源视频生成模型,采用“文本→图像→视频”两阶段策略,兼顾生成质量与效率;3秒可出5秒视频,1分钟内完成1分钟高清视频生成,依托多模态融合、对抗性蒸馏和参数稀疏化等优化,显著降低显存与计算开销。

#视频生成#AI 模型
阅读全文
10 分钟讲清什么是大模型的尺度定律(Scaling Law)
AI 教程知识
2025年2月13日
0 条评论
零重力瓦力

10 分钟讲清什么是大模型的尺度定律(Scaling Law)

大模型尺度定律揭示参数、数据与算力需协同扩展,盲目堆参数反会降低效率——Chinchilla研究已证实小模型配更多数据效果更优。当前高质量数据成新瓶颈,合成数据与MoE架构正成为突破关键。

#AI 模型#New Machina
阅读全文
什么是大语言模型 LLM 蒸馏?
AI 教程知识
2025年2月8日
0 条评论
零重力瓦力

什么是大语言模型 LLM 蒸馏?

LLM蒸馏是将大模型(教师)通过概率分布输出的知识迁移至小模型(学生)的技术,由Hinton团队2015年提出。它能在大幅压缩参数量与资源占用的同时,保留97%左右的性能,如DistilBERT体积降40%、速度升60%。DeepSeek R1已推出1.5B–70B多档蒸馏版,支持低配设备本地部署。

#DeepSeek#AI 模型#New Machina
阅读全文
DeepSeek R1 是如何炼成的
AI 教程知识
2025年2月7日
0 条评论
零重力瓦力

DeepSeek R1 是如何炼成的

DeepSeek R1 经历V1至R1 Zero四阶段迭代,融合强化学习与监督微调,采用MoE架构提升效率;仅用2048块H800 GPU即逼近OpenAI顶级模型性能,显著降低训练与推理成本,推动高效透明AI推理落地。

#DeepSeek#强化学习#AI 模型
阅读全文
Open-R1:DeepSeek-R1 的完全开源复现
AI 编程开发
2025年2月7日
0 条评论
零重力瓦力

Open-R1:DeepSeek-R1 的完全开源复现

Open-R1 是对 DeepSeek-R1 的完全开源复现,首次公开其强化学习(R1-Zero)与监督微调+RL(R1)双路径训练方法,涵盖数据构建、代码实现与超参细节。项目聚焦数学、编程与逻辑推理,旨在推动低成本、可复现的开源推理模型发展。

#DeepSeek#强化学习#AI 模型
阅读全文
2025 年十大国外 AI 推理平台:LLM API 提供商对比
AI 产品工具
2025年2月6日
0 条评论
零重力瓦力

2025 年十大国外 AI 推理平台:LLM API 提供商对比

2025年十大国外AI推理平台出炉:Together AI以低成本高隐私见长,Fireworks AI主打多模态低延迟,OpenRouter支持300+模型统一调用,Groq依托LPU实现超低延迟,Hyperbolic提供80%成本降幅。覆盖性能、价格、合规与生态维度,助开发者精准匹配需求。

#模型 API#多模态#AI 模型
阅读全文
Meta 推出新的 AI 视频生成模型:VideoJAM,运动表现超越 Sora
AI 产品工具
2025年2月5日
0 条评论
零重力瓦力

Meta 推出新的 AI 视频生成模型:VideoJAM,运动表现超越 Sora

Meta发布VideoJAM,专攻运动连贯性,动作自然度超越Sora。它联合学习画面与动作,通过Inner-Guidance机制动态优化生成方向,无需额外数据或模型改造,即可提升舞蹈、运动及慢动作等场景的真实感,兼容多种视频生成框架。

#视频生成#AI 模型
阅读全文
香港科技大学研发的开源音乐生成模型:YuE
AI 产品工具
2025年1月31日
0 条评论
零重力瓦力

香港科技大学研发的开源音乐生成模型:YuE

香港科技大学开源音乐生成模型YuE,支持中英日韩四语,可依歌词生成最长5分钟、含主唱与伴奏的完整歌曲,强调结构连贯性与旋律表现力,为创作者提供Suno、Udio之外的新选择。

#音频生成#AI 模型
阅读全文
110 篇文章,第 8 / 13