Gemma 4

Google 开源推理+Agent模型,Apache 2.0,四种尺寸

✅ 有免费额度 🇨🇳 国内可用

什么是 Gemma 4

Gemma 4 是 Google DeepMind 2026年4月发布的开源模型家族,专为推理和 Agent 工作流设计。提供四种尺寸:31B(Dense,最强)、26B-A4B(MoE,高效)、E4B 和 E2B(轻量)。Apache 2.0 协议,商用无限制。

如何本地运行

最简单的方式是用 Ollama:ollama run gemma4:31b。31B 版需要约 20GB 显存/内存,26B-A4B 仅需约 4GB 激活参数。支持 Speculative decoding 加速 29%(代码场景 +50%)。

编码能力对比

Gemma 4 31B 在推理和 Agent 任务上表现优异,但编码 benchmark 略逊于 Qwen 3.6-35B-A3B(64.7% vs 71.4%)。优势在于 Apache 2.0 协议最宽松,原生 function calling 支持最好。
🐑 小羊助手