#开源模型
Mistral 把编程 Agent 扔进云里
Mistral 推出 Medium 3.5 开源模型与 Vibe 远程代理,将编程协作从“人机同步”转向“异步委派”。128B 稠密模型以 77.6% 的 SWE-Bench 成绩超越 Claude Sonnet 4,支持自部署。Vibe 允许开发者在云端沙箱并行运行多个任务,自动提交 PR 并通知审查。配合 Le Chat 通用工作模式,该方案适合追求效率的团队及关注数据安全的独立开发者,重新定义了 AI 辅助编码的工作流。
NVIDIA 开源 Nemotron 3 Nano Omni:一个模型通吃视频音频文字
NVIDIA 开源 Nemotron 3 Nano Omni,以 30B 总参数、3B 激活的混合专家架构,实现视频、音频与文字的统一处理。该模型通过 Mamba 与 Transformer 结合及高效视频采样技术,将多模态推理吞吐量提升最高 9 倍,显著降低延迟与显存占用。相比传统三模型拼接方案,它更适合构建高并发 AI Agent,支持本地消费级显卡运行,已在文档智能、客服等场景验证实际价值。
LM Studio 和 Ollama 到底该选哪个
本地部署大模型时,LM Studio 与 Ollama 各有侧重。前者主打图形化界面,适合快速上手和模型对比。后者作为后台引擎,性能更优且支持自动硬件调用,在自动化工作流中表现更佳。随着版本迭代,两者功能边界虽逐渐模糊,但在 API 兼容性、并发处理及智能体集成方面,Ollama 仍具备明显优势。用户可根据是追求便捷体验还是深度集成需求来选择合适的工具。
DeepSeek V4来了,美国 AI 的真正麻烦才刚开始
暂无摘要,点击查看全文与评论。

Gemini Embedding 2 正式发布
Google 正式推出 Gemini Embedding 2 正式版,这是一款原生多模态嵌入模型,可统一处理文本、图像、视频和音频。该版本从预览进入生产可用阶段,标志着多模态检索技术从实验研究转向标准化基础设施,为企业提供稳定的多模态搜索与推理能力。

Gemma 4 :Google 最强开源模型
Google DeepMind 发布 Gemma 4 开源模型系列,基于 Gemini 3 架构,提供 26B 、 31B 、 E2B 、 E4B 四种规格。该系列在参数效率上实现重大突破, 26B MoE 模型性能可超越参数量 20 倍的竞品。支持函数调用、 256K 上下文、多语言及视觉处理,采用 Apache 2.0 许可证允许商业免费使用。 Google 同时发起 Gemma 4 Good Challenge 挑战赛,推动具有社会影响力的应用开发。

智谱 AI 发布开源 GLM-5.1 编程模型
智谱 AI 发布 GLM-5.1 编程模型,专为编程和智能体工程设计,可持续运行 8 小时完成规划、执行、测试、修复等全流程任务。基准测试表现亮眼, SWE-Bench Pro 获 58.4 分,超越 GPT-5.4 等竞品。具备 20 万 token 上下文窗口等技术优势,现已面向开发者开放。此举标志着智谱 AI 在编程和智能体基础设施领域迈出关键一步。