NVIDIA NIM 免费 API 完整指南:100+ 顶级模型零成本调用
NVIDIA 在 build.nvidia.com 上搞了一个被严重低估的免费 AI 推理平台。100+ 个顶级模型,不要钱,不要信用卡,OpenAI 兼容格式,中国大陆可直连。
为什么值得关注?
- 100+ 模型,覆盖对话、编程、推理、多模态
- 无额度限制(已取消原来的 1000/5000 次限制)
- 不需要信用卡,注册即用
- OpenAI 兼容,改一行
base_url就能接入 - 中国大陆可直连,无需代理
- 40 RPM 速率限制(每分钟 40 次),可申请提升到 200
免费模型精选
顶级对话模型
- MiniMax M2.7(
minimaxai/minimax-m2.7)— 230B 参数,编程/推理/办公全能 - Kimi K2.5(
moonshotai/kimi-k2.5)— MoE 架构,100 万上下文,中文顶级 - GLM-5(
z-ai/glm-5)— 智谱最新旗舰 - DeepSeek V3.2(
deepseek-ai/deepseek-v3.2)— 671B MoE,编程之王 - DeepSeek R1(
deepseek-ai/deepseek-r1)— 671B MoE,推理之王 - Qwen 3.5(
qwen/qwen3.5)— 阿里通义千问
推理 & 编程模型
- Nemotron-3-Super-120B(
nvidia/nemotron-3-super-120b-a12b)— NVIDIA 自研,推理强 - Llama 4(
meta/llama-4)— Meta 最新开源 - Gemma 4 31B-IT(
google/gemma-4-31b-it)— Google 最新,Agentic 能力强 - Step 3.5 Flash(
stepfun-ai/step-3.5-flash)— 阶跃星辰,速度极快
完整列表请访问 build.nvidia.com/models
注册教程(3 分钟)
第一步:访问 build.nvidia.com,点击右上角 Login / Sign Up,邮箱注册(建议企业邮箱)
第二步:登录后访问 API Keys 页面,点击 Generate API Key,复制保存(格式:nvapi-xxxx)
第三步:开始调用。API 端点:https://integrate.api.nvidia.com/v1
没有绑卡、没有审核、没有等待。
代码示例
Python(OpenAI SDK)
from openai import OpenAI
client = OpenAI(
api_key="nvapi-你的API密钥",
base_url="https://integrate.api.nvidia.com/v1"
)
response = client.chat.completions.create(
model="deepseek-ai/deepseek-v3.2",
messages=[{"role": "user", "content": "用 Python 写一个快速排序"}],
temperature=0.6,
max_tokens=4096
)
print(response.choices[0].message.content)
cURL
curl -X POST https://integrate.api.nvidia.com/v1/chat/completions \
-H "Authorization: Bearer nvapi-你的API密钥" \
-H "Content-Type: application/json" \
-d '{
"model": "moonshotai/kimi-k2.5",
"messages": [{"role": "user", "content": "你好"}],
"temperature": 0.7,
"max_tokens": 4096
}'
Node.js
import OpenAI from 'openai';
const client = new OpenAI({
apiKey: 'nvapi-你的API密钥',
baseURL: 'https://integrate.api.nvidia.com/v1'
});
const response = await client.chat.completions.create({
model: 'minimaxai/minimax-m2.7',
messages: [{ role: 'user', content: '帮我写一个 React 组件' }],
});
console.log(response.choices[0].message.content);
接入开发工具
Cursor / Windsurf
设置中添加自定义模型:Base URL 填 https://integrate.api.nvidia.com/v1,API Key 填你的 nvapi- 密钥。
Claude Code / Aider / OpenCode
export OPENAI_BASE_URL=https://integrate.api.nvidia.com/v1
export OPENAI_API_KEY=nvapi-你的密钥
配合 OpenRelay
用 OpenRelay 可以把 NVIDIA NIM 作为 Provider 之一,配合 Groq、Gemini 等免费额度实现自动 failover。详见 OpenRelay 教程。
注意事项
- 40 RPM 限制 — 个人使用够了,需要更高可在 NVIDIA 论坛申请
- 部分模型可能临时下线 — 多配几个备选
- 大模型响应较慢 — 轻量任务用 Nemotron Nano 或 Step Flash
- 数据隐私 — 免费 API 可能收集使用数据,敏感信息别发
和其他免费平台对比
NVIDIA NIM 在免费模型数量(100+)和额度(无限制)上都是碾压级的。Groq 只有 5-8 个模型,Cloudflare AI 每天 10K 次,OpenRouter 免费版每天 50 次。唯一限制是 40 RPM,但个人开发完全够用。
常见问题
Q: 真的完全免费吗?
是的。之前有额度限制(普通邮箱 1000 次,企业邮箱 5000 次),现在已经取消。只有 40 RPM 的速率限制。
Q: 中国大陆能直连吗?
可以。integrate.api.nvidia.com 中国大陆可直连,不需要代理。
Q: 和直接用 DeepSeek/Kimi 官方 API 有什么区别?
模型一样,但 NVIDIA NIM 一个 API Key 调用 100+ 模型,不用分别注册各家账号。
Q: 适合生产环境吗?
不建议。40 RPM 限制和可能的模型下线都是风险。生产环境建议用官方付费 API、开源网关或经过验证的商业 API 网关作为备用。
---
更多免费 AI 资源,请访问 yangmao.ai — 42 家 AI 厂商免费额度完整指南。