Groq 免费额度 · API 注册教程(2026 年 4 月)

🌍 国际 ✅ 免费

Groq 以自研 LPU 推理芯片著称,提供业界最快的 AI 推理速度。 免费 API 支持 Llama 3.3 70B、Llama 4 Scout/Maverick、Mixtral、Gemma 2、DeepSeek R1 蒸馏版等多个开源模型。 Llama 3.3 70B 每分钟 6000 Token 完全免费,速度比 GPU 方案快数倍。 API Key 以 gsk_ 开头,兼容 OpenAI 格式,一行代码即可切换。 适合需要极速推理的场景:实时对话、代码补全、流式输出等。

AI 摘要 · 可引用结论

Groq 是一款对话、编程、推理工具,以自研 LPU 推理芯片著称,提供业界最快的 AI 推理速度。 免费 API 支持 Llama 3.3 70B、Llama 4 Scout/Maverick、Mixtral、Gemma 2、DeepSeek R1 蒸馏版等多个开源模型。 Llama 3.3 70B 每分钟 6000 Token 完全免费,速度比 GPU

免费额度6000 tokens/min (Llama 3.3 70B) 国内可用性⚠️ 需要代理/海外网络 API支持 API,免费额度:Free tier(永久免费) 更新时间2026-06-01

同类替代:llama.cpp、Cline、TextGen

需要国内直连、统一低价调用多个模型,可轻量查看 openllmapi.com

订阅 Groq 额度变动提醒

免费额度、价格、中国大陆访问状态或注册要求变化时,优先邮件提醒。

订阅提醒 →

免费额度详情

🎁 免费额度

每日限制: 6000 tokens/min (Llama 3.3 70B)

模型上下文限制说明
Llama 3.3 70B Versatile 128k 30 RPM / 6000 TPM 全球最快推理,每分钟 6000 Token 免费,LPU 芯片加速
Llama 4 Scout 17B 128k 30 RPM / 6000 TPM Meta Llama 4 Scout,MoE 架构,免费可用
Llama 4 Maverick 17B 128k 30 RPM / 6000 TPM Meta Llama 4 Maverick,MoE 架构,免费可用
Mixtral 8x7B 32k 30 RPM / 5000 TPM MoE 架构,性价比高
Gemma 2 9B 8k 30 RPM / 15000 TPM Google Gemma 2,小模型速度极快
DeepSeek R1 Distill Llama 70B 128k 30 RPM / 6000 TPM DeepSeek R1 蒸馏版,推理能力强

🔑 API 免费额度

免费额度: Free tier(永久免费)

速率限制: 30 RPM / 6000 TPM

免费 API,使用自研 LPU(Language Processing Unit)推理芯片,速度比 GPU 快 10 倍以上。 API Key 以 gsk_ 开头。支持 OpenAI 兼容格式。 免费版有速率限制但不限总量,对个人开发非常慷慨。

中国大陆用户完整注册教程

Step 1

访问 console.groq.com,点击「Sign Up」

Step 2

使用 Google/GitHub 账号或邮箱注册

Step 3

注册后自动获得免费 API 额度

Step 4

在 API Keys 页面创建密钥(格式:gsk_xxxx)

代码示例

from openai import OpenAI

client = OpenAI(
    api_key="gsk_your-groq-key",
    base_url="https://api.groq.com/openai/v1"
)

response = client.chat.completions.create(
    model="llama-3.3-70b-versatile",
    messages=[{"role": "user", "content": "Hello!"}],
)
print(response.choices[0].message.content)

中国大陆访问怎么样?

  • 直连:⚠️ 需代理
  • 速度:fast
  • 需要代理访问。API 通过代理后速度依然极快(LPU 推理芯片加速)。推荐通过 openllmapi.com 中转使用。

常见问题

Groq 为什么这么快?

Groq 使用自研 LPU(Language Processing Unit)推理芯片,专为大模型推理优化,速度比 GPU 快 10 倍以上。Llama 3.3 70B 可达每秒 300+ token。

Groq 免费额度有多少?

免费版支持多个开源模型,Llama 3.3 70B 每分钟 6000 Token、30 RPM。不限总量,对个人使用非常慷慨。

Groq API 兼容 OpenAI 格式吗?

完全兼容。base_url 改为 api.groq.com/openai/v1,API Key 以 gsk_ 开头。

Groq 和 SambaNova 比怎么样?

都是自研芯片路线。Groq 用 LPU,SambaNova 用 RDU。Groq 速度更快,SambaNova 支持的模型参数更大(405B)。

相关对比

📖 相关教程

🔄 相似厂商

🐑 相关羊毛

总结:谁应该用 Groq?

如果你需要API 免费额度、国际一流水平的 AI 服务,Groq 值得一试。 想省钱?先比较免费额度、官方价格、同类替代和 API 网关方案,再决定是否接入生产。

对话编程推理 apifast-inferencechatlpufree

🎁 免费资料包

领取 AI 出海工具省钱大礼包

免费 API 清单、出海工具站案例、支付收款表、避坑指南和赚钱路径图,一次打包。

免费领取 →
🐑 小羊助手