结论
- 国内友好 Agent 路线:Qwen compatible mode。
- 成本优先路线:DeepSeek,并限制循环和输出。
- 速度测试路线:Groq 的低延迟开源模型。
- 生产路线:一个 OpenAI 兼容抽象,便宜模型主跑,检查工具配置是否被改写,高质量模型兜底。
怎么做
- 确认工具是否支持自定义 OpenAI-compatible base_url、模型名、streaming,以及是否会悄悄改写 provider 设置。
- 创建 Qwen、DeepSeek、Groq、GLM 或中转 key,保存在服务端或工具 secret store。
- 先跑只读任务:解释代码、总结报错、草拟 diff、写测试但不应用。
- 开放写操作前,加 git diff review、命令白名单、最大迭代、预算告警。
- 选择 provider 时看 accepted patch rate,不要只看 token 单价。
推荐路径对比
| 平台 | 免费/额度 | 适合 |
|---|---|---|
| 通义千问 | 7000 万 tokens | 国内 Cursor/自定义 Agent 代码路线 |
| DeepSeek | $5 注册 / 当前额度 | 低价代码 Agent 循环和仓库自动化 |
| 智谱 GLM | 500 万 tokens | 国内 GLM 低摩擦测试 |
| Groq | 开发者限额变化 | 高速开源模型补全 |
| OpenLLMAPI | 注册体验额度 | Qwen/DeepSeek + GPT/Claude/Gemini 一个 key 兜底 |
自有平台承接
想让 Cursor、OpenClaw、自研 Agent 共用一个端点?
保持 OpenAI client 形态,按成本和失败规则在 Qwen、DeepSeek、Claude、GPT、Gemini、Groq 类高速模型间路由。
FAQ
Cursor 能用自定义 OpenAI 兼容 API 吗?
只要工具当前版本暴露 base URL、key、model 设置,一般可以。具体以当前 UI/文档为准,因为版本和套餐会变化。
代码 Agent 哪个 provider 最便宜?
DeepSeek 通常是成本基线,但 Qwen 在国内/代码/长上下文任务上可能更划算。要看每个被接受 patch 的成本。
代码 Agent 为什么需要 fallback?
Agent 会卡循环、工具调用失败或生成不能通过测试的 patch。强模型兜底有时比便宜模型反复失败更省钱。
给写权限前要测什么?
Streaming、工具调用、patch 质量、shell 命令行为、限速、以及工具遇到 provider 错误时的处理。