DeepSeek API 批处理价格：Cache、Off-Peak 与 Fallback 成本

DeepSeek 是批处理任务最便宜的 API 吗？

直接答案

DeepSeek 对批量总结、抽取、代码和推理任务可能是强低价路线，但必须按当前官方价格、cache hit/miss、off-peak 规则、重试和 fallback 调用一起算。生产批处理应把 DeepSeek 与 Qwen、GLM 和一条网关路线按每个成功 item 成本比较。

DeepSeek API 批处理价格DeepSeek cache off peak 价格批处理最便宜 APILLM 批处理 fallback

结论

平台	免费/额度	适合
DeepSeek	核验官方价格	低价批量推理、抽取和总结
通义千问	注册额度变化	中国大陆友好长上下文批处理 fallback
智谱 GLM	注册 tokens 变化	国产结构化输出 fallback
LLM 成本计算器	免费工具	批处理运行前预算估算
OpenLLMAPI	体验额度变化	批处理路线日志、硬上限、fallback 和 provider 切换

把 DeepSeek、Qwen、GLM 放到一个 endpoint 后，用硬预算、验证感知 fallback 和单 item 成本日志控制批处理。

能依赖旧 DeepSeek 价格截图吗？

不能。大批处理前要看官方 pricing 页面，因为 token 单价、cache 规则或 off-peak 条款可能变化。

批处理为什么会变贵？

大输入、长输出、低 cache 命中、结构化输出无效、重试和 fallback 风暴都会放大成本。

什么时候跑 fallback？

只在明确验证失败、超时、限速、JSON 无效或低置信后触发。不要默认每个 item 都 fallback。

应该追踪什么指标？

每个成功 item 成本、无效输出率、fallback 率、重试次数、cache 命中率和总批次预算消耗。