结论
- 原型阶段看谁最快拿到真实 API key,并支持 OpenAI-compatible chat completions。
- 长期运行不能只看 token 单价,还要验证限速、断线重连、tool call 和失败处理。
- 生产阶段保持 provider 可配置,并给每个 agent 加预算日志。
怎么做
- 先列出 agent 负载:写代码、浏览器自动化、邮件/后台、研究或定时监控。
- 用同一套 OpenAI SDK 测一个国内友好模型和一个全球 fallback。
- 跑 30 分钟循环,记录 token、重试、延迟和 tool call 失败。
- 无人值守前设置月预算上限和告警。
- 需要 fallback 和日志时,再接 OpenLLMAPI 或其他网关。
推荐路径对比
| 平台 | 免费/额度 | 适合 |
|---|---|---|
| 通义千问 | 注册额度变化 | 中国大陆友好的 coding/agent 测试 |
| DeepSeek | 以官方价格/额度为准 | 低成本推理和代码任务 |
| 智谱 GLM | 额度变化 | 国产 fallback 与 Claude Code 风格实验 |
| OpenLLMAPI | 体验政策变化 | 一个 key、fallback、日志和路由 |
自有平台承接
让 OpenClaw agent 带预算运行
保留 OpenAI-compatible 客户端,加入 fallback 路由和每个 agent 的花费日志,避免无人值守循环烧钱。
FAQ
OpenClaw 能用任意 OpenAI-compatible API 吗?
通常可以,只要能配置 base_url、api_key 和 model;但上线前要测 streaming、tool call 和重连。
agent 应该直接选最便宜模型吗?
不建议。重试、错误 tool call 和上下文失败会把便宜模型变贵。
什么时候值得上网关?
多个 agent 共用 key、需要 fallback、或需要按 agent 归因成本和告警时。