LIVE DeepSeek V3 · 50 RPD 免费·Gemini 2.0 · 15 RPM 免费 API·硅基流动 · 14 模型免费·Groq · Llama 3.3 免费推理·通义千问 · 100 万 tokens 免费·Kimi · 无限免费对话· LIVE DeepSeek V3 · 50 RPD 免费·Gemini 2.0 · 15 RPM 免费 API·硅基流动 · 14 模型免费·Groq · Llama 3.3 免费推理·通义千问 · 100 万 tokens 免费·Kimi · 无限免费对话·

Gemma 4

Google 开源推理+Agent模型，Apache 2.0，四种尺寸

✅ 有免费额度 🇨🇳 中国大陆可用

什么是 Gemma 4

Gemma 4 是 Google DeepMind 2026年4月发布的开源模型家族，专为推理和 Agent 工作流设计。提供四种尺寸：31B（Dense，最强）、26B-A4B（MoE，高效）、E4B 和 E2B（轻量）。Apache 2.0 协议，商用无限制。

如何本地运行

最简单的方式是用 Ollama：ollama run gemma4:31b。31B 版需要约 20GB 显存/内存，26B-A4B 仅需约 4GB 激活参数。支持 Speculative decoding 加速 29%（代码场景 +50%）。

编码能力对比

Gemma 4 31B 在推理和 Agent 任务上表现优异，但编码 benchmark 略逊于 Qwen 3.6-35B-A3B（64.7% vs 71.4%）。优势在于 Apache 2.0 协议最宽松，原生 function calling 支持最好。

🎁 免费资料包

领取 AI 出海工具省钱大礼包

免费 API 清单、出海工具站案例、支付收款表、避坑指南和赚钱路径图，一次打包。

免费领取 →

🐑 小羊助手