资讯标签
资讯首页/#AI 模型

#AI 模型

开源 AI 视频生成模型又添新成员:SkyReels-V1
AI 产品工具
2025年2月19日
0 条评论
零重力瓦力

开源 AI 视频生成模型又添新成员:SkyReels-V1

SkyReels-V1 是一款专注人物表现的开源AI视频生成模型,基于腾讯HunyuanVideo深度微调,在VBench多项指标上超越主流开源模型。支持33种表情与400+自然动作,具备电影级光影构图能力,推理框架提速58.3%,普通显卡即可流畅运行。

#视频生成#AI 模型
阅读全文
横空出世的 Grok 3 是否具有碾压性的优势?
AI 新闻资讯
2025年2月19日
0 条评论
零重力瓦力

横空出世的 Grok 3 是否具有碾压性的优势?

Grok 3在数学、科学、编程等推理任务中全面超越Gemini 2、Claude 3.5 Sonnet与GPT-4o,Chatbot Arena盲测登顶1400分;搭载可追溯信源的Deep Search智能搜索工具,支持交叉验证与可控检索;已上线网页版及iOS应用,Grok 2即将开源,Grok 3后续亦计划开源。

#Grok#Deep Research#AI 模型
阅读全文
Grok 3 vs DeepSeek:AI 竞赛中的新对决
AI 编程开发
2025年2月18日
0 条评论
零重力瓦力

Grok 3 vs DeepSeek:AI 竞赛中的新对决

xAI发布Grok 3,计算资源提升10倍,支持128K上下文与输出,在数学、代码等任务上超越DeepSeek;后者以开源、低成本(费用仅为Grok 3约3%)和高定制性见长。二者分别代表闭源高性能与开源普惠两条技术路径。

#Grok#DeepSeek#AI 模型
阅读全文
国产开源 AI 视频生成模型:跃问(Step-Video-T2V)
AI 产品工具
2025年2月17日
0 条评论
零重力瓦力

国产开源 AI 视频生成模型:跃问(Step-Video-T2V)

国产开源视频生成模型“跃问(Step-Video-T2V)”参数达300亿,支持中英文输入,可生成最长204帧高清视频;自研Video-VAE实现时空高效压缩,结合3D全注意力DiT与流匹配去噪,并通过Video-DPO优化真实感。模型已开源,官网与GitHub免费获取。

#视频生成#AI 模型
阅读全文
RAG 和 模型微调哪个好,怎么用?
AI 教程知识
2025年2月16日
0 条评论
零重力瓦力

RAG 和 模型微调哪个好,怎么用?

RAG借助外部向量库实时检索信息,成本低、易更新,适合需动态数据的场景;模型微调则通过领域数据训练提升专业性与准确性,但耗资源且知识静态。二者并非互斥,常结合使用——RAG补时效,微调强专精。

#RAG#AI 模型#New Machina
阅读全文
Magic 1-For-1:一分钟生成高质量视频,速度快到超乎想象
AI 产品工具
2025年2月13日
0 条评论
零重力瓦力

Magic 1-For-1:一分钟生成高质量视频,速度快到超乎想象

Magic 1-For-1 是一款开源视频生成模型,采用“文本→图像→视频”两阶段策略,兼顾生成质量与效率;3秒可出5秒视频,1分钟内完成1分钟高清视频生成,依托多模态融合、对抗性蒸馏和参数稀疏化等优化,显著降低显存与计算开销。

#视频生成#AI 模型
阅读全文
10 分钟讲清什么是大模型的尺度定律(Scaling Law)
AI 教程知识
2025年2月13日
0 条评论
零重力瓦力

10 分钟讲清什么是大模型的尺度定律(Scaling Law)

大模型尺度定律揭示参数、数据与算力需协同扩展,盲目堆参数反会降低效率——Chinchilla研究已证实小模型配更多数据效果更优。当前高质量数据成新瓶颈,合成数据与MoE架构正成为突破关键。

#AI 模型#New Machina
阅读全文
什么是大语言模型 LLM 蒸馏?
AI 教程知识
2025年2月8日
0 条评论
零重力瓦力

什么是大语言模型 LLM 蒸馏?

LLM蒸馏是将大模型(教师)通过概率分布输出的知识迁移至小模型(学生)的技术,由Hinton团队2015年提出。它能在大幅压缩参数量与资源占用的同时,保留97%左右的性能,如DistilBERT体积降40%、速度升60%。DeepSeek R1已推出1.5B–70B多档蒸馏版,支持低配设备本地部署。

#DeepSeek#AI 模型#New Machina
阅读全文
DeepSeek R1 是如何炼成的
AI 教程知识
2025年2月7日
0 条评论
零重力瓦力

DeepSeek R1 是如何炼成的

DeepSeek R1 经历V1至R1 Zero四阶段迭代,融合强化学习与监督微调,采用MoE架构提升效率;仅用2048块H800 GPU即逼近OpenAI顶级模型性能,显著降低训练与推理成本,推动高效透明AI推理落地。

#DeepSeek#强化学习#AI 模型
阅读全文
114 篇文章,第 8 / 13