Google Gemma 4：310 亿参数干翻万亿大模型？

Google 发布 Gemma 4，以 31B 稠密和 26B 混合专家模型挑战千亿级大参数。该系列在 Arena AI 榜单跻身开源前三，工具调用满分，数学与推理能力出色，且能在消费级 PC 甚至手机、树莓派等边缘设备流畅运行。尽管上下文窗口为 256K 略逊于顶级竞品，但凭借 Apache 2.0 协议及广泛的部署支持，其高性价比与实用性使其成为开发者构建智能体及本地化应用的首选。

发布于2026年4月7日 10:42

编辑零重力瓦力

评论0 条

阅读23

#Gemma #Google

开源模型什么时候能真正跑赢那些动辄千亿参数的大怪兽？Google 最新发布的 Gemma 4 或许给出了一个有说服力的答案。

Gemma 4 模型家族有 4 个版本，最受关注的是 31B 稠密模型和 26B 的混合专家版模型（激活参数只有 4B）。在 Arena AI 文本排行榜上，31B 拿到了全球开源模型第三名，而它的对手 Qwen 3.5 总参数高达 3970 亿，Kimi K2.5 更是万亿级别。这样规模的模型，顶配 GB300 一样跑不动。而 Gemma 4 31B 在大多数中高端消费级 PC 上就能跑。

Gemma 4 的工具调用能力非常出色。SteveVibe 用 ToolCall 15 基准测试跑了所有 4 个版本的模型，31B 拿了满分。模型原生支持函数调用、结构化 JSON 输出、系统指令，能够无缝接入智能体工作流。AIME 2026 数学测试达到 89%，GPQA Diamond 84.3%，这样的的体量能有这样的成绩，确实也没什么好挑剔的。

Gemma 4 的两个小尺寸版本 E2B 和 E4B 用了逐层嵌入技术（PLE），每个解码层有独立的小型嵌入表，实际推理时参数量远小于名义值。模型还专门为手机、树莓派这类边缘设备做了优化，并且原生支持音频输入。

让人稍感遗憾的是上下文窗口，最大只有 256K，和目前 1M 上下文的顶级模型相比还是有不少差距。

模型基于 Apache 2.0 协议，Hugging Face、Ollama、LM Studio 都能直接下，商用也没有问题。总的来说，Google 这款开源模型，性能算不上最好，但实用性和性价比都没话说。

一段代码让网站出海，这个 AI 翻译工具把多语言 SEO 玩明白了

跨境电商网站常因语言壁垒导致高跳出率。Weglot 是一款 AI 翻译工具，仅需几分钟即可通过添加脚本实现网站多语言本地化，且保持原有排版。该工具支持可视化编辑、术语表锁定及团队协作，便于后续维护。同时，它能自动优化 hreflang 标签、独立 URL 及元数据，解决多语言 SEO 难题。借助母语内容布局小语种市场，企业可以低成本获取流量红利，有效提升海外转化率。

SCOPE 给 AI 绘画装上了 “语义追踪器”，复杂提示词终于不用反复抽卡了

中科大团队发布 SCOPE 框架，通过结构化语义规格解决 AI 绘画中复杂提示词语义丢失问题。该系统将提示词拆解为实体、约束及未知项，构建包含分解、合成、生成、验证的四步循环，并辅以检索、推理和修复技能，实现生成过程全程可追溯与精准修复。团队还推出 Gen-Arena 评测基准及 EGIP 指标。实验显示 SCOPE 在多项基准中表现优异，为多元素控制场景提供了工程化解决方案，代码已开源。

Stable Audio 3.0 发布：开源音频生成从 11 秒走到 6 分钟

Stability AI 发布开源音频模型 Stable Audio 3.0，最长可生成 6 分 20 秒立体声音频。该模型采用 SAME 架构实现 4096 倍压缩，支持变量长度生成与局部编辑，Small 版本可在移动端离线运行。训练数据均获授权，规避版权风险。提供四个变体及 LoRA 微调文档，社区许可允许商用。此次升级标志着开源音频生成从短音效迈向完整歌曲创作，为开发者提供了本地化、合规的高质量音频生成方案。

#开源模型#AI 音乐

阅读全文

互动讨论

评论区

围绕《Google Gemma 4：310 亿参数干翻万亿大模型？》展开交流，未登录用户可浏览评论，登录后可参与讨论。

评论数

登录后参与评论

支持发表观点与回复一级评论，互动后将同步到消息中心。

登录后评论

暂无评论，欢迎成为第一个参与讨论的人。

Google Gemma 4：310 亿参数干翻万亿大模型？

相关文章

一段代码让网站出海，这个 AI 翻译工具把多语言 SEO 玩明白了

SCOPE 给 AI 绘画装上了 “语义追踪器”，复杂提示词终于不用反复抽卡了

Stable Audio 3.0 发布：开源音频生成从 11 秒走到 6 分钟

评论区