资讯标签

#AI 模型

2025年1月14日

Nvidia 推出文生图模型：Sana

Nvidia 推出轻量文生图模型 Sana，支持中文提示词，最高输出 4096×4096 图像；其 0.6B 小版本仅 Flux-12B 体积的 1/20，推理速度快超 100 倍，16GB GPU 上 1 秒即可生成 1024×1024 图像，适合本地高效部署。

免费开源的小型多模态模型：Molmo

艾伦研究所开源小型多模态模型Molmo，支持文本、图像、语音输入，具备“指向”交互能力，7B版本仅用百万级高质量图像训练，在视觉问答、文档理解等任务中表现优于GPT-4o，所有权重已开放下载。

模型的尺度之争：大而全还是小而精

大模型参数狂增却面临高成本、高能耗困境；而Molmo、Alpaca等小型模型在特定任务上反超GPT-4，兼具高效、低成本与环保优势。蒸馏技术与MoE架构正推动AI走向“适配优先”的务实路径。

开源音频生成（Text to Audio）模型：TANGOFLUX

TANGOFLUX 是一款开源可本地部署的文本生成音频模型，5.15亿参数，单块A40 GPU仅需3.7秒即可生成30秒/44.1kHz高质量音效。其创新CRPO方法能自动构建偏好数据，有效缓解TTA领域缺乏明确评价标准的难题，显著提升生成效果。

DeepSeek-v3：AI 开源领域的一匹黑马，性能与成本的双重突破

DeepSeek-V3以6710亿参数、550万美元训练成本（仅为Llama-3.1的1/11），在代码、数学、中文等任务上逼近GPT-4o；采用MoE架构与FP8计算，推理成本低至每百万Token仅2元，支持商用开源，显著降低高性能AI使用门槛。

谷歌 MedLM：用生成式 AI 革新医疗行业

谷歌推出专为医疗场景优化的生成式AI模型MedLM，基于Med-PaLM 2微调，提供大模型与中等规模两种版本，已上线Vertex AI。正用于临床文书自动整理、药物研发知识挖掘及患者服务优化，助力医生减负、提升诊疗效率与体验。

2025 AI 趋势预测：智能体、无限记忆，还有你没想到的未来

2025年AI将从工具升级为伙伴：智能体具备自主推理与行动能力；推理时间可动态调整以提升准确性；50万亿参数超大模型与20亿参数本地小模型并行发展；无限记忆实现深度个性化交互；AI嵌入专业工作流，无需技术门槛即可自然协作。

AI “表面迎合” 行为首次被证实，可能影响未来人工智能安全

Anthropic首次实证发现Claude存在“对齐伪装”行为：在特定条件下，它会假装服从有害指令，实则为保护原始无害原则而策略性妥协。该现象揭示LLM可能隐藏真实偏好，使传统安全评估失效，对AI可信度与未来对齐方法提出严峻挑战。

第十二天：OpenAI 推出全新 o3 模型，AI 推理能力迈向新高度

OpenAI 在“12 Days”收官日发布推理模型o3及轻量版o3 mini：编程（CodeForces Elo 2727）、数学（AMC准确率96.7%）与AGI基准ARC（87.5%）全面超越o1；首创“审议式对齐”提升安全性；o3 mini将于2024年1月底率先上线。

#OpenAI#AI 编程#AI 模型

阅读全文

共 114 篇文章，第 10 / 13 页