NVIDIA NIM

NVIDIA 官方 AI 推理 API，开发者免费请求需以 Build 控制台为准

✅ 有免费额度 🇨🇳 中国大陆可用

什么是 NVIDIA NIM

NVIDIA NIM（NVIDIA Inference Microservices）是 NVIDIA 官方提供的免费 AI 推理 API。在 build.nvidia.com 上注册后，可以免费调用 100+ 个顶级 AI 模型，包括 Gemma 4、Nemotron、Llama 3.3、MiniMax 等。

最大亮点：完全免费、不需要信用卡、无额度限制（只有 RPM 限制）、OpenAI 兼容格式、中国大陆可直连。这可能是目前最被低估的免费 AI 资源。

免费额度详解

完全免费，没有 token 限制，只有频率限制：
- 默认 40 RPM（每分钟 40 次请求）
- 可申请提升到 200 RPM
- 100+ 模型全部免费

热门可用模型：
- Gemma 4 31B（Google 最新）
- Nemotron 3 Super 120B（NVIDIA 自研）
- Llama 3.3 70B（Meta）
- MiniMax M2.7
- Kimi K2.5

注册只需要邮箱，不需要信用卡。

编辑提示

编辑提示：如果只是 API 推理，通常不需要租 GPU；先比较官方免费额度、速率限制和延迟。

中国大陆使用指南

NVIDIA NIM 在中国大陆可以直连，不需要代理。延迟比海外稍高但完全可用。

注册 build.nvidia.com 账号也不需要代理。这是中国大陆开发者最容易获取的免费 AI API 之一。

常见问题

Q: 真的完全免费吗？
A: 是的，NVIDIA 用这个推广自己的 GPU 生态。免费是长期策略。

Q: 40 RPM 够用吗？
A: 个人开发和测试够了。生产环境建议申请 200 RPM 或准备备用 API relay。

Q: 和 Groq 免费版比怎么样？
A: NIM 模型更多（100+ vs 10+），Groq 速度更快。两个都用，互补。