Gemma 4
Google 开源推理+Agent模型,Apache 2.0,四种尺寸
什么是 Gemma 4
Gemma 4 是 Google DeepMind 2026年4月发布的开源模型家族,专为推理和 Agent 工作流设计。提供四种尺寸:31B(Dense,最强)、26B-A4B(MoE,高效)、E4B 和 E2B(轻量)。Apache 2.0 协议,商用无限制。
如何本地运行
最简单的方式是用 Ollama:ollama run gemma4:31b。31B 版需要约 20GB 显存/内存,26B-A4B 仅需约 4GB 激活参数。支持 Speculative decoding 加速 29%(代码场景 +50%)。
编码能力对比
Gemma 4 31B 在推理和 Agent 任务上表现优异,但编码 benchmark 略逊于 Qwen 3.6-35B-A3B(64.7% vs 71.4%)。优势在于 Apache 2.0 协议最宽松,原生 function calling 支持最好。