Gemma 4

Google 开源推理+Agent模型,Apache 2.0,四种尺寸

✅ 有免费额度 🇨🇳 中国大陆可用

什么是 Gemma 4

Gemma 4 是 Google DeepMind 2026年4月发布的开源模型家族,专为推理和 Agent 工作流设计。提供四种尺寸:31B(Dense,最强)、26B-A4B(MoE,高效)、E4B 和 E2B(轻量)。Apache 2.0 协议,商用无限制。

如何本地运行

最简单的方式是用 Ollama:ollama run gemma4:31b。31B 版需要约 20GB 显存/内存,26B-A4B 仅需约 4GB 激活参数。支持 Speculative decoding 加速 29%(代码场景 +50%)。

编码能力对比

Gemma 4 31B 在推理和 Agent 任务上表现优异,但编码 benchmark 略逊于 Qwen 3.6-35B-A3B(64.7% vs 71.4%)。优势在于 Apache 2.0 协议最宽松,原生 function calling 支持最好。

🎁 免费资料包

领取 AI 出海工具省钱大礼包

免费 API 清单、出海工具站案例、支付收款表、避坑指南和赚钱路径图,一次打包。

免费领取 →
🐑 小羊助手