结论
- DeepSeek 可能很省钱,但价格和额度必须以官方文档为准。
- cache-hit 和 off-peak 规则对真实成本的影响可能大于 headline token 单价。
- Agent 和代码工具要比较成功任务成本,而不是只看 token 单价。
- 价格、额度或模型可用性变化时,fallback 能保护业务。
怎么做
- 打开 DeepSeek 官方 pricing 页面,记录当前输入、输出、cache 和 off-peak 规则。
- 用真实 token 日志估算前三个 workflow 的月成本。
- 同一批任务测试 Qwen、GLM、Groq/OpenRouter 和一个强兜底。
- 比较包含重试、无效 JSON、延迟和失败的 accepted-task 成本。
- 需要自动切换和预算告警时,用 OpenLLMAPI 或自建网关。
推荐路径对比
| 平台 | 免费/额度 | 适合 |
|---|---|---|
| DeepSeek | 核验当前价格/额度 | 当前经济性仍胜出时的低价推理和代码 |
| 通义千问 DashScope | 注册额度变化 | 中国大陆友好长上下文和代码兜底 |
| 智谱 GLM | 注册 tokens 变化 | 国产预算 fallback |
| Groq/OpenRouter | 免费路线变化 | 高速开源模型或多模型对比 |
| OpenLLMAPI | 体验额度变化 | DeepSeek + 替代路线的统一日志和路由 |
自有平台承接
别让价格变化打断应用
把 DeepSeek 保留为一路,加上替代 fallback,并用一个 endpoint 追踪成功任务成本。
FAQ
DeepSeek 还是最便宜 API 吗?
有时是,但不总是。要核验官方当前价格,并用包含重试和 cache 行为的成功任务成本来算。
off-peak 价格变了怎么办?
把 off-peak 当优化,不要当唯一商业模型。保留 fallback 和预算告警。
应该迁出 DeepSeek 吗?
不一定。如果 benchmark 仍然胜出就保留;但把 provider 配置抽象出来,方便未来切换。
先测哪些替代?
成本敏感 workflow 先测 Qwen、GLM、Groq/OpenRouter,并给困难任务准备一个强兜底。