Groq 免费推理 API — LPU 芯片加速,Llama 3.3 70B 每分钟 6000 Token
Groq 使用自研 LPU(Language Processing Unit)推理芯片,提供业界最快的 AI 推理速度。 免费模型列表: - Llama 3.3 70B Versatile — 6000 TPM / 30 RPM - Llama 4 Scout 17B — 6000 TPM / 30 RPM - Llama 4 Maverick 17B — 6000 TPM / 30 RPM - Mixtral 8x7B — 5000 TPM / 30 RPM - Gemma 2 9B — 15000 TPM / 30 RPM - DeepSeek R1 Distill Llama 70B — 6000 TPM / 30 RPM 亮点: - 速度比 GPU 方案快 10 倍以上,Llama 3.3 70B 可达 300+ token/秒 - API Key 以 gsk_ 开头,兼容 OpenAI 格式 - 不限总量,只限速率 - 需要代理访问(中国大陆可通过 openllmapi.com 中转)
是否值得申请?
建议优先申请:门槛低、成功概率相对高。
你领到了吗?帮我们验证一下:
成功率:— · 0 人反馈
免费额度、截止时间、领取条件变动时,优先通过邮件提醒。
领取步骤
- 打开 Groq 官方页面或领取入口。
- 准备条件:注册 Groq 账号
- 准备条件:邮箱验证
- 领取后先用一个真实任务测试额度是否到账。
- 如果额度过期或不可用,查看本页替代方案。
额度与限制
Groq 提供基于 LPU 芯片的全球最快免费推理 API。Llama 3.3 70B 每分钟 6000 Token,30 RPM。还支持 Llama 4 Scout/Maverick、Mixtral、Gemma 2、DeepSeek R1 蒸馏版。API Key 以 gsk_ 开头。
领取要求
- 注册 Groq 账号
- 邮箱验证
过期或不可用时的替代方案
如果只是想调用模型 API,建议先对比官方平台、API 网关和同类替代方案:查看 API 网关选型
相关羊毛
常见问题
Groq 免费 LPU 推理 API 现在还能领取吗?
当前状态:长期有效。具体以官网领取页为准。
领取 Groq 免费推理 API — LPU 芯片加速,Llama 3.3 70B 每分钟 6000 Token 需要什么条件?
注册 Groq 账号、邮箱验证
Groq 免费推理 API — LPU 芯片加速,Llama 3.3 70B 每分钟 6000 Token 中国大陆可用吗?
可能需要代理、API 中转或选择中国大陆替代方案。