结论
- 最适合的 provider 是工具能稳定调用的,而不是 token 单价最低的。
- 先确认四件事:base_url、API key header、模型名、streaming/tool-call 兼容。
- DeepSeek 和 Qwen 适合低成本代码任务,GLM/硅基流动适合中国大陆兜底。
- 一个统一兼容端点可以减少 RooCode/Cline/Kilocode 在不同机器上的配置漂移。
怎么做
- 建一个小测试项目,分别跑代码修改、解释、失败测试修复。
- provider 类型选 OpenAI-compatible/custom endpoint,填写 base_url、key、精确模型名。
- 必要时关闭不支持的特性:并行 tool calls、严格 JSON mode 或特殊 streaming。
- 同一个 repo 任务对比 DeepSeek、Qwen、GLM 和更强兜底模型。
- 团队共享配置尽量放环境变量或网关,让所有工具使用同一 endpoint contract。
推荐路径对比
| 平台 | 免费/额度 | 适合 |
|---|---|---|
| DeepSeek | 注册/当前额度随官方变化 | 低成本代码修改和推理循环 |
| 通义千问 | 百炼额度随活动变化 | 代码 Agent、长上下文、中国大陆友好 |
| 智谱 GLM | 注册 tokens 随官方变化 | 国产兜底和 GLM 测试 |
| OpenRouter | 免费模型限速 | 快速 no-card 兼容 endpoint 测试 |
| OpenLLMAPI | 体验额度随活动变化 | 多个代码工具和模型共用一个端点 |
自有平台承接
给所有代码工具一个兼容端点
RooCode、Cline、Kilocode、Cursor、OpenClaw 共用一个 OpenAI-compatible key,再按任务路由 DeepSeek、Qwen、GLM、GPT、Claude 或 Gemini。
FAQ
为什么 Cline/RooCode 会回退到错误 endpoint?
常见原因包括 provider 类型不匹配、缺少 /v1 路径、模型名错误、workspace settings 缓存,或工具内有默认 provider 覆盖。
免费 API 能跑代码 Agent 吗?
可以测试,但代码 Agent 很容易触发限速。建议保留一个低价付费路线和一个更强兜底路线。
先从哪个模型开始?
低价循环先测 DeepSeek,代码/上下文先测 Qwen;规划和最终 review 再接更强模型。
所有 OpenAI-compatible API 都支持 tool calls 吗?
不是。上线前必须测试 function/tool calls、JSON mode、streaming 和错误格式。