资讯标签

#Mistral

2026年5月12日

Mistral 把编程 Agent 扔进云里

Mistral 推出 Medium 3.5 开源模型与 Vibe 远程代理，将编程协作从“人机同步”转向“异步委派”。128B 稠密模型以 77.6% 的 SWE-Bench 成绩超越 Claude Sonnet 4，支持自部署。Vibe 允许开发者在云端沙箱并行运行多个任务，自动提交 PR 并通知审查。配合 Le Chat 通用工作模式，该方案适合追求效率的团队及关注数据安全的独立开发者，重新定义了 AI 辅助编码的工作流。

混合专家模型：AI 界的专家会诊制如何让大模型更高效？

混合专家（MoE）架构让大模型像“专家会诊”：通过门控机制动态调用不同子网络处理输入，训练中自然形成专长。Mixtral用8个专家超越GPT-3.5，DeepSeek R1总参6710亿但仅激活370亿，显著降本增效。

#DeepSeek#Mistral#New Machina

阅读全文