Groq 免费额度 · API 注册教程（2026 年 4 月）

🌍 国际 ✅ 免费

Groq 以自研 LPU 推理芯片著称，提供业界最快的 AI 推理速度。免费 API 支持 Llama 3.3 70B、Llama 4 Scout/Maverick、Mixtral、Gemma 2、DeepSeek R1 蒸馏版等多个开源模型。 Llama 3.3 70B 每分钟 6000 Token 完全免费，速度比 GPU 方案快数倍。 API Key 以 gsk_ 开头，兼容 OpenAI 格式，一行代码即可切换。适合需要极速推理的场景：实时对话、代码补全、流式输出等。

访问官网 →

免费额度 API 价格免信用卡中国大陆可用开源替代替代品

AI 摘要 · 可引用结论

Groq 是一款对话、编程、推理工具，以自研 LPU 推理芯片著称，提供业界最快的 AI 推理速度。免费 API 支持 Llama 3.3 70B、Llama 4 Scout/Maverick、Mixtral、Gemma 2、DeepSeek R1 蒸馏版等多个开源模型。 Llama 3.3 70B 每分钟 6000 Token 完全免费，速度比 GPU

免费额度6000 tokens/min (Llama 3.3 70B) 中国大陆可用性⚠️ 需要代理/海外网络 API支持 API，免费额度：Free tier（永久免费） 更新时间2026-06-24

同类替代：llama.cpp、Cline、TextGen

需要中国大陆直连、统一低价调用多个模型，可轻量查看 openllmapi.com。

订阅 Groq 额度变动提醒

免费额度、价格、中国大陆访问状态或注册要求变化时，优先邮件提醒。

订阅提醒 →

免费额度详情

🎁 免费额度

每日限制: 6000 tokens/min (Llama 3.3 70B)

模型	上下文	限制	说明
Llama 3.3 70B Versatile	`128k`	`30 RPM / 6000 TPM`	全球最快推理，每分钟 6000 Token 免费，LPU 芯片加速
Llama 4 Scout 17B	`128k`	`30 RPM / 6000 TPM`	Meta Llama 4 Scout，MoE 架构，免费可用
Llama 4 Maverick 17B	`128k`	`30 RPM / 6000 TPM`	Meta Llama 4 Maverick，MoE 架构，免费可用
Mixtral 8x7B	`32k`	`30 RPM / 5000 TPM`	MoE 架构，性价比高
Gemma 2 9B	`8k`	`30 RPM / 15000 TPM`	Google Gemma 2，小模型速度极快
DeepSeek R1 Distill Llama 70B	`128k`	`30 RPM / 6000 TPM`	DeepSeek R1 蒸馏版，推理能力强

🔑 API 免费额度

免费额度: Free tier（永久免费）

速率限制: 30 RPM / 6000 TPM

免费 API，使用自研 LPU（Language Processing Unit）推理芯片，速度比 GPU 快 10 倍以上。 API Key 以 gsk_ 开头。支持 OpenAI 兼容格式。免费版有速率限制但不限总量，对个人开发非常慷慨。

中国大陆用户完整注册教程

Step 1

访问 console.groq.com，点击「Sign Up」

Step 2

使用 Google/GitHub 账号或邮箱注册

Step 3

注册后自动获得免费 API 额度

Step 4

在 API Keys 页面创建密钥（格式：gsk_xxxx）

代码示例

from openai import OpenAI

client = OpenAI(
    api_key="gsk_your-groq-key",
    base_url="https://api.groq.com/openai/v1"
)

response = client.chat.completions.create(
    model="llama-3.3-70b-versatile",
    messages=[{"role": "user", "content": "Hello!"}],
)
print(response.choices[0].message.content)

中国大陆访问怎么样？

直连：⚠️ 需代理
速度：fast
需要代理访问。API 通过代理后速度依然极快（LPU 推理芯片加速）。推荐通过 openllmapi.com 中转使用。

常见问题

Groq 为什么这么快？

Groq 使用自研 LPU（Language Processing Unit）推理芯片，专为大模型推理优化，速度比 GPU 快 10 倍以上。Llama 3.3 70B 可达每秒 300+ token。

Groq 免费额度有多少？

免费版支持多个开源模型，Llama 3.3 70B 每分钟 6000 Token、30 RPM。不限总量，对个人使用非常慷慨。

Groq API 兼容 OpenAI 格式吗？

完全兼容。base_url 改为 api.groq.com/openai/v1，API Key 以 gsk_ 开头。

Groq 和 SambaNova 比怎么样？

都是自研芯片路线。Groq 用 LPU，SambaNova 用 RDU。Groq 速度更快，SambaNova 支持的模型参数更大（405B）。

免费 API 专题入口

AI 创业机会库基于这些免费 AI 工具，普通人能做什么项目、怎么做 MVP、怎么变现看机会 → 免费 AI API 总入口 DeepSeek、Qwen、Grok、GLM、混元、Groq、Cloudflare Workers AI 免费额度对比查看专题 → API 中转与中国大陆可用方案 OpenAI 兼容、中国大陆直连、免费模型、API relay / API VPN 搜索需求承接查看方案 → FreeLLMAPI 中文深度页开源免费 LLM API 聚合、GitHub 项目、替代方案和部署教程查看教程 →

🔄 相似厂商

llama.cpp MIT 开源，本地运行不限量（受硬件限制） ⭐ 117,872 Cline 插件本身免费开源；接 DeepSeek/Qwen 等便宜模型几乎零成本。 ⭐ 63,788 TextGen AGPL-3.0 开源免费，本地私有运行 ⭐ 47,369 Aider 工具本身 MIT 开源免费，模型自带 API key 按用付费。 ⭐ 46,636

总结：谁应该用 Groq？

如果你需要API 免费额度、国际一流水平的 AI 服务，Groq 值得一试。想省钱？先比较免费额度、官方价格、同类替代和 API 网关方案，再决定是否接入生产。

对话编程推理 apifast-inferencechatlpufree

💬 信息有误？帮我们改进

📱 Telegram 反馈 ✉️ 邮件反馈