结论
- Qwen、GLM 和 DeepSeek 都值得测试,但对应不同配置和生产需求。
- 大多数 setup 失败来自 base_url 错、模型名过期、模型权限未开或 key 属于错误项目。
- coding agent 场景要比较 tool 行为、JSON 稳定性、长上下文成本、延迟和 fallback 率。
- 网关可避免团队把三个 provider key 分发到每个 app 和 agent。
怎么做
- 先确定一个主 workload:coding agent、chatbot、RAG、批量文案或 workflow automation。
- 创建官方 provider key,并从当前文档复制兼容 endpoint/model 设置。
- 用显式 baseURL、key、model、timeout 和 max tokens,对 Qwen、GLM、DeepSeek 跑同一个 smoke test。
- 评分输出接受率、延迟、成本、streaming、JSON/tool 行为和错误格式。
- 需要一个 endpoint、provider 日志、预算上限和三者 fallback 时,用 OpenLLMAPI。
推荐路径对比
| 平台 | 免费/额度 | 适合 |
|---|---|---|
| 通义千问 DashScope | 注册额度变化 | 中国大陆友好代码、中文和长上下文主路线 |
| 智谱 GLM | 注册 tokens 变化 | 国产 GLM 备份和中文商业 workflow |
| DeepSeek | 核验当前价格 | 低价推理/代码基准和 fallback |
| 硅基流动 | 免费/开源路线变化 | 多模型实验和额外中国可访问覆盖 |
| OpenLLMAPI | 体验额度变化 | 统一 OpenAI-compatible endpoint、日志和 fallback |
自有平台承接
把 Qwen、GLM、DeepSeek 放到一条路线后测试
用一个兼容 endpoint 管理 provider 日志、fallback 规则和花费上限,让 app 与 coding agent 配置更干净。
FAQ
应该先配置哪个?
在中国大陆或需要阿里生态兼容时先 Qwen;需要国产 fallback 加 GLM;低价推理基准测 DeepSeek。
三者都能用 OpenAI-compatible client 吗?
很多 workflow 可以,但 endpoint 路径、模型名、auth header、streaming 和 tool 支持都要逐个 provider 测试。
为什么出现 unauthorized?
检查账号/项目归属、模型权限、当前 base_url、模型名、认证格式,以及工具是否仍指向 OpenAI。
什么时候用网关?
初次 smoke test 用直连 key;生产 app 需要共享 key、路线日志、fallback 和预算限制时用网关。