NVIDIA NIM 免费 API 完整指南:100+ 顶级模型零成本调用

NVIDIA 在 build.nvidia.com 上搞了一个被严重低估的免费 AI 推理平台。100+ 个顶级模型,不要钱,不要信用卡,OpenAI 兼容格式,中国大陆可直连。

为什么值得关注?

  • 100+ 模型,覆盖对话、编程、推理、多模态
  • 无额度限制(已取消原来的 1000/5000 次限制)
  • 不需要信用卡,注册即用
  • OpenAI 兼容,改一行 base_url 就能接入
  • 中国大陆可直连,无需代理
  • 40 RPM 速率限制(每分钟 40 次),可申请提升到 200

免费模型精选

顶级对话模型

  • MiniMax M2.7minimaxai/minimax-m2.7)— 230B 参数,编程/推理/办公全能
  • Kimi K2.5moonshotai/kimi-k2.5)— MoE 架构,100 万上下文,中文顶级
  • GLM-5z-ai/glm-5)— 智谱最新旗舰
  • DeepSeek V3.2deepseek-ai/deepseek-v3.2)— 671B MoE,编程之王
  • DeepSeek R1deepseek-ai/deepseek-r1)— 671B MoE,推理之王
  • Qwen 3.5qwen/qwen3.5)— 阿里通义千问

推理 & 编程模型

  • Nemotron-3-Super-120Bnvidia/nemotron-3-super-120b-a12b)— NVIDIA 自研,推理强
  • Llama 4meta/llama-4)— Meta 最新开源
  • Gemma 4 31B-ITgoogle/gemma-4-31b-it)— Google 最新,Agentic 能力强
  • Step 3.5 Flashstepfun-ai/step-3.5-flash)— 阶跃星辰,速度极快

完整列表请访问 build.nvidia.com/models

注册教程(3 分钟)

第一步:访问 build.nvidia.com,点击右上角 Login / Sign Up,邮箱注册(建议企业邮箱)

第二步:登录后访问 API Keys 页面,点击 Generate API Key,复制保存(格式:nvapi-xxxx

第三步:开始调用。API 端点:https://integrate.api.nvidia.com/v1

没有绑卡、没有审核、没有等待。

代码示例

Python(OpenAI SDK)

from openai import OpenAI

client = OpenAI(

api_key="nvapi-你的API密钥",

base_url="https://integrate.api.nvidia.com/v1"

)

response = client.chat.completions.create(

model="deepseek-ai/deepseek-v3.2",

messages=[{"role": "user", "content": "用 Python 写一个快速排序"}],

temperature=0.6,

max_tokens=4096

)

print(response.choices[0].message.content)

cURL

curl -X POST https://integrate.api.nvidia.com/v1/chat/completions \

-H "Authorization: Bearer nvapi-你的API密钥" \

-H "Content-Type: application/json" \

-d '{

"model": "moonshotai/kimi-k2.5",

"messages": [{"role": "user", "content": "你好"}],

"temperature": 0.7,

"max_tokens": 4096

}'

Node.js

import OpenAI from 'openai';

const client = new OpenAI({

apiKey: 'nvapi-你的API密钥',

baseURL: 'https://integrate.api.nvidia.com/v1'

});

const response = await client.chat.completions.create({

model: 'minimaxai/minimax-m2.7',

messages: [{ role: 'user', content: '帮我写一个 React 组件' }],

});

console.log(response.choices[0].message.content);

接入开发工具

Cursor / Windsurf

设置中添加自定义模型:Base URL 填 https://integrate.api.nvidia.com/v1,API Key 填你的 nvapi- 密钥。

Claude Code / Aider / OpenCode

export OPENAI_BASE_URL=https://integrate.api.nvidia.com/v1

export OPENAI_API_KEY=nvapi-你的密钥

配合 OpenRelay

OpenRelay 可以把 NVIDIA NIM 作为 Provider 之一,配合 Groq、Gemini 等免费额度实现自动 failover。详见 OpenRelay 教程

注意事项

  • 40 RPM 限制 — 个人使用够了,需要更高可在 NVIDIA 论坛申请
  • 部分模型可能临时下线 — 多配几个备选
  • 大模型响应较慢 — 轻量任务用 Nemotron Nano 或 Step Flash
  • 数据隐私 — 免费 API 可能收集使用数据,敏感信息别发

和其他免费平台对比

NVIDIA NIM 在免费模型数量(100+)和额度(无限制)上都是碾压级的。Groq 只有 5-8 个模型,Cloudflare AI 每天 10K 次,OpenRouter 免费版每天 50 次。唯一限制是 40 RPM,但个人开发完全够用。

常见问题

Q: 真的完全免费吗?

是的。之前有额度限制(普通邮箱 1000 次,企业邮箱 5000 次),现在已经取消。只有 40 RPM 的速率限制。

Q: 中国大陆能直连吗?

可以。integrate.api.nvidia.com 中国大陆可直连,不需要代理。

Q: 和直接用 DeepSeek/Kimi 官方 API 有什么区别?

模型一样,但 NVIDIA NIM 一个 API Key 调用 100+ 模型,不用分别注册各家账号。

Q: 适合生产环境吗?

不建议。40 RPM 限制和可能的模型下线都是风险。生产环境建议用官方付费 API、开源网关或经过验证的商业 API 网关作为备用。

---

更多免费 AI 资源,请访问 yangmao.ai — 42 家 AI 厂商免费额度完整指南。