#AI 模型
10分钟搞定!本地安装 DeepSeek-R1,全流程教程
DeepSeek-R1 国产开源大模型,推理能力媲美 OpenAI-o1。本文提供基于 Ollama 的本地安装全流程,适配 Windows/macOS/Linux,10–15 分钟即可离线运行。涵盖硬件要求、6 款模型(1.5B–70B)对比及一键启动命令,轻量设备也能低门槛体验高性能推理。
让 AI 成为科学家们改变科研方式的新力量
CSIRO AI科学总监Stefan Harrer指出,生成式AI正成为科学家的“超级助手”:实时追踪前沿、整合多源数据、加速蛋白质设计与药物研发——分析周期从数月缩至数天,新药研发时间减半。AI不替代人类,而是拓展认知边界,成为撬动科学突破的新支点。
Replicate:按需付费使用 AI 模型的方案
Replicate 提供按需付费的 AI 模型调用服务,支持 Flux、海螺 AI、Llama、mmaudio 等多种生成式模型,可按 GPU 类型(如 H100 或 T4)计费,最低 $0.81/小时,适合低频使用或模型测试,比固定月费更灵活经济。
GPT-5 早已存在,而且已经在暗中影响着世界
有迹象表明,GPT-5可能已被OpenAI内部训练并用于模型蒸馏——类似Anthropic用未发布的Claude Opus 3.5提升Sonnet 3.6性能。这种“不发布、只内用”的策略,正推动大模型竞争从追求参数规模转向优化性价比与协同增益。
能够融合声音的小型 TTS(文本转语音)模型:Kokoro
Kokoro 是仅 82M 参数的轻量级 TTS 模型,支持从十种预设声线中任选两种,按任意比例混合生成个性化语音——如男女声 60:40 融合。提供简洁 API,访问 kokorotts.com 即可快速调用。
Nvidia 推出文生图模型:Sana
Nvidia 推出轻量文生图模型 Sana,支持中文提示词,最高输出 4096×4096 图像;其 0.6B 小版本仅 Flux-12B 体积的 1/20,推理速度快超 100 倍,16GB GPU 上 1 秒即可生成 1024×1024 图像,适合本地高效部署。
免费开源的小型多模态模型:Molmo
艾伦研究所开源小型多模态模型Molmo,支持文本、图像、语音输入,具备“指向”交互能力,7B版本仅用百万级高质量图像训练,在视觉问答、文档理解等任务中表现优于GPT-4o,所有权重已开放下载。
模型的尺度之争:大而全还是小而精
大模型参数狂增却面临高成本、高能耗困境;而Molmo、Alpaca等小型模型在特定任务上反超GPT-4,兼具高效、低成本与环保优势。蒸馏技术与MoE架构正推动AI走向“适配优先”的务实路径。
开源音频生成(Text to Audio)模型:TANGOFLUX
TANGOFLUX 是一款开源可本地部署的文本生成音频模型,5.15亿参数,单块A40 GPU仅需3.7秒即可生成30秒/44.1kHz高质量音效。其创新CRPO方法能自动构建偏好数据,有效缓解TTA领域缺乏明确评价标准的难题,显著提升生成效果。