结论
- Qwen 很适合作为国内友好代码 Agent 和长上下文仓库任务的首测模型。
- 用 OpenAI 兼容模式,后续可 fallback 到 DeepSeek、GLM、GPT、Claude。
- 先只读,再在 smoke test 和预算限制通过后开放编辑。
- 常见失败来自模型名写死、base_url 配错、Agent 循环不设上限。
怎么做
- 创建 DashScope / 百炼 key,服务端保存为 DASHSCOPE_API_KEY。
- OpenAI SDK base_url 设置为 https://dashscope.aliyuncs.com/compatible-mode/v1,model 用环境变量。
- 先跑只读任务:解释文件、总结失败测试、提出小 diff。
- 再开放编辑,并设置最大迭代、max tokens、命令白名单、git diff 检查。
- 当 Qwen 连续两次测试失败或超预算时,切到兜底模型。
推荐路径对比
| 平台 | 免费/额度 | 适合 |
|---|---|---|
| 通义千问 | 7000 万 tokens | 国内代码 Agent 主路线 |
| DeepSeek | $5 注册 / 当前额度 | 低成本代码兜底 |
| 智谱 GLM | 500 万 tokens | 国内 GLM 兜底 |
| OpenLLMAPI | 注册体验额度 | 一个端点覆盖 Qwen + Claude/GPT/Gemini |
自有平台承接
想 Qwen 主跑,Claude/GPT 兜底?
让代码 Agent 保持一个 OpenAI 兼容 client,按任务成本和失败规则在 Qwen、DeepSeek、Claude、GPT、Gemini 间路由。
FAQ
Qwen compatible mode 的 base_url 是什么?
使用 https://dashscope.aliyuncs.com/compatible-mode/v1,配合 OpenAI 兼容 SDK client。
代码 Agent 应该选哪个 Qwen 模型?
选控制台当前可用的 Qwen coder 或最强通用模型,再用自己的仓库任务验证。模型名变化快,必须配置化。
Qwen 能替代 Claude Code 或 Cursor 模型吗?
如果工具支持自定义 OpenAI-compatible endpoint,可以跑类似代码 Agent 流程,但要验证工具调用、patch 和失败行为。
怎么控制 Qwen Agent 成本?
限制迭代次数、输出 tokens、改动文件数量、shell 命令和重试次数,并记录每个被接受 patch 的成本。