结论
- 大多数 LangChain 迁移应是配置变更,不是重写。
- 兼容不等于完全一致:要测 streaming、tools、JSON、embeddings 和错误体。
- Qwen 和 GLM 设置应以当前官方 compatible-mode 文档为准。
- 多 chains、agents 或团队共用 provider 时,网关路由更容易审计。
怎么做
- 把 provider 设置放入环境变量:base_url、api_key、model、timeout、max tokens。
- 在完整 app 外先跑最小 LangChain chat call,确认 endpoint 和 key 可用。
- 测试 chain 特性:streaming、结构化输出、tool calls、embeddings、rerank 和 retries。
- 记录 tokens、provider、model、延迟、重试次数、最终状态和 user/workspace id。
- 直接 LangChain provider 配置在多团队或多功能中难审计时,用 OpenLLMAPI。
推荐路径对比
| 平台 | 免费/额度 | 适合 |
|---|---|---|
| DeepSeek | 核验当前价格 | 低价 LangChain 推理 workflow |
| 通义千问 DashScope | 注册额度变化 | 中国大陆友好应用的官方兼容模式 |
| 智谱 GLM | 注册 tokens 变化 | 国产兼容 endpoint 实验 |
| OpenRouter/Groq | 免费路线变化 | 快速模型对比和 demo |
| OpenLLMAPI | 体验额度变化 | LangChain fallback、预算和路线日志 |
自有平台承接
给 LangChain 一条可审计模型路线
保留兼容 SDK 设置,同时为 chains、agents 和多环境加入 fallback、成本日志和预算控制。
FAQ
只改 base_url 就够吗?
基础 chat 往往可以。生产还要验证模型名、鉴权 header、streaming、tool calls、结构化输出和 retries。
为什么 LangChain 还是请求 OpenAI?
可能是默认 provider、漏设 base_url、环境变量名错误,或 wrapper preset 覆盖了目标 endpoint。
应该用 Qwen、DeepSeek 还是 GLM?
用你的 chain benchmark。DeepSeek 常偏低价,Qwen 适合中国大陆友好 workflow,GLM 适合作国产 fallback。
什么时候网关比直连 provider 好?
需要一个 key、fallback、按 chain 成本日志、预算或不重发版切 provider 时。