结论
- 免卡 API 适合 Next.js demo,不适合作为无限生产流量。
- API key 放 server route 或后端环境变量,不要暴露到浏览器。
- 优先选 OpenAI-compatible endpoint,迁移时只改 baseURL/model。
- 邀请用户前加请求限制、日志、预算和 fallback。
怎么做
- 选择公开免费额度、模型名、地区支持和数据条款的 provider。
- 创建专用服务端 key,保存到环境变量。
- 在 OpenAI client 或 Vercel AI SDK provider 层显式配置 baseURL、apiKey、model。
- 先跑 100-token route-handler smoke test,再测 streaming、JSON、额度扣减和限速错误。
- 真实用户依赖前迁到 OpenLLMAPI 或其他可控生产路线。
推荐路径对比
| 平台 | 免费/额度 | 适合 |
|---|---|---|
| OpenRouter | 免费路线变化 | 快速免卡 Vercel demo |
| Groq | 开发者限额变化 | 低延迟开源模型 chatbot 测试 |
| 通义千问 DashScope | 注册额度变化 | 中国大陆友好兼容 chatbot 路线 |
| 智谱 GLM | 注册 tokens 变化 | 国产 GLM 原型和 fallback |
| OpenLLMAPI | 体验额度变化 | 带预算和 fallback 的生产承接 |
自有平台承接
把 demo key 迁成安全生产路线
保留 OpenAI-compatible 接口,在用户访问前加入预算日志、fallback 和路由控制;注册 CTA 会携带 question-page UTM 方便归因。
FAQ
可以把免费 API key 放 Next.js client component 吗?
不可以。放在 route handler、server action 或后端环境变量。
免卡 API 能接 Vercel AI SDK 吗?
provider 支持 OpenAI 兼容或自定义 provider 配置时通常可以。先测 baseURL、streaming 和模型名。
能用免费 key 直接上线吗?
只建议用于验证。生产需要清楚 billing、防滥用限制、预算日志和 fallback。
第一步测什么?
短 chat 请求、streaming chunk、JSON 输出、额度扣减、延迟和限速行为。