Cloudflare Workers AI 免费额度 · API 注册教程(2026 年 4 月)
Cloudflare Workers AI 是 Cloudflare 推出的边缘 AI 推理平台。 $5/月 Workers 套餐自带每天 10000 次免费 AI 调用,永久有效,不会过期。 支持 50+ 开源模型:LLM(Llama 3.1/3.3、Gemma、Mistral)、图片生成(Stable Diffusion XL)、 嵌入向量(BGE)、语音转文字(Whisper)等。 最大优势:如果你已经在用 Cloudflare Workers,这基本是白送的。 推理在全球 300+ 边缘节点运行,延迟极低。国内可直连。 超出免费额度后按量计费,不会突然断服务。
免费额度详情
🎁 免费额度
每日限制: 每天 10000 次免费调用
| 模型 | 上下文 | 限制 | 说明 |
|---|---|---|---|
| @cf/meta/llama-3.1-8b-instruct | 128k | 10000/day | Meta Llama 3.1 8B,轻量对话模型 |
| @cf/meta/llama-3.3-70b-instruct-fp8-fast | 128k | 10000/day | Llama 3.3 70B FP8 加速版 |
| @cf/google/gemma-7b-it-lora | 8k | 10000/day | Google Gemma 7B,支持 LoRA 微调 |
| @cf/stabilityai/stable-diffusion-xl-base-1.0 | | 10000/day | Stable Diffusion XL 图片生成,完全免费 |
| @cf/baai/bge-base-en-v1.5 | | 10000/day | BGE 嵌入模型,适合 RAG 和语义搜索 |
| @cf/microsoft/phi-2 | 2k | 10000/day | 微软 Phi-2 小模型 |
| @cf/mistral/mistral-7b-instruct-v0.2-lora | 32k | 10000/day | Mistral 7B,支持 LoRA |
🔑 API 免费额度
免费额度: 每天 10000 神经元(永久有效)
速率限制: 10000 requests/day
Cloudflare Workers $5/月套餐自带 Workers AI,每天 10000 神经元免费。 50+ 开源模型全部可用,含 LLM、图片生成(SD XL)、嵌入向量、语音转文字等。 API 兼容 OpenAI 格式(通过 AI Gateway),也可直接用 Workers AI binding。 推理在 Cloudflare 全球边缘网络运行,延迟极低。国内可直连。
国内用户完整注册教程
访问 dash.cloudflare.com,登录或注册 Cloudflare 账号
进入 Workers & Pages,订阅 $5/月 Workers Paid 套餐
在 Workers AI 页面即可看到可用模型列表
通过 AI Gateway 创建 API endpoint,获取 API Token
也可在 Worker 代码中直接使用 env.AI.run() 调用
代码示例
# 方式一:通过 AI Gateway(OpenAI 兼容)
from openai import OpenAI
client = OpenAI(
api_key="your-cloudflare-api-token",
base_url="https://gateway.ai.cloudflare.com/v1/{account_id}/{gateway_id}"
)
response = client.chat.completions.create(
model="@cf/meta/llama-3.1-8b-instruct",
messages=[{"role": "user", "content": "Hello!"}],
)
print(response.choices[0].message.content)
# 方式二:REST API
import requests
response = requests.post(
f"https://api.cloudflare.com/client/v4/accounts/{account_id}/ai/run/@cf/meta/llama-3.1-8b-instruct",
headers={"Authorization": "Bearer your-api-token"},
json={"messages": [{"role": "user", "content": "Hello!"}]}
)
print(response.json())
国内访问怎么样?
- 直连:✅ 可以
- 速度:fast
- 国内可直连 Cloudflare 边缘网络,延迟低。Workers AI 通过 Cloudflare 全球 CDN 加速。
常见问题
Workers AI 真的免费吗?
需要 $5/月的 Workers Paid 套餐,但套餐内每天 10000 神经元是免费的。如果你已经在用 Workers,等于白送。
10000 神经元能用多少次?
取决于模型。Llama 3.1 8B 大约每次 500 token 消耗 1 神经元,每天可调用数千次。SD XL 图片生成每张约 10 神经元。
支持哪些图片生成模型?
主要是 Stable Diffusion XL Base 1.0,完全免费。适合批量生成产品图、博客配图等。
和 NVIDIA NIM 比怎么样?
NVIDIA NIM 模型更多更强(100+ 模型含 DeepSeek V3.2、Kimi K2.5 等),但 Workers AI 的优势是边缘部署、延迟低、和 Cloudflare 生态深度集成。
📖 相关教程
🔄 相似厂商
🐑 相关羊毛
总结:谁应该用 Cloudflare Workers AI?
如果你需要API 免费额度、国际一流水平的 AI 服务,Cloudflare Workers AI 值得一试。 想省钱?通过 openllmapi.com 一个 Key 调用 Cloudflare Workers AI 和其他 30+ 家模型,官方价 5-7 折。