Cloudflare Workers AI 免费额度 · API 注册教程(2026 年 4 月)

🌍 国际 ✅ 免费

Cloudflare Workers AI 是 Cloudflare 推出的边缘 AI 推理平台。 $5/月 Workers 套餐自带每天 10000 次免费 AI 调用,永久有效,不会过期。 支持 50+ 开源模型:LLM(Llama 3.1/3.3、Gemma、Mistral)、图片生成(Stable Diffusion XL)、 嵌入向量(BGE)、语音转文字(Whisper)等。 最大优势:如果你已经在用 Cloudflare Workers,这基本是白送的。 推理在全球 300+ 边缘节点运行,延迟极低。国内可直连。 超出免费额度后按量计费,不会突然断服务。

免费额度详情

🎁 免费额度

每日限制: 每天 10000 次免费调用

模型上下文限制说明
@cf/meta/llama-3.1-8b-instruct 128k 10000/day Meta Llama 3.1 8B,轻量对话模型
@cf/meta/llama-3.3-70b-instruct-fp8-fast 128k 10000/day Llama 3.3 70B FP8 加速版
@cf/google/gemma-7b-it-lora 8k 10000/day Google Gemma 7B,支持 LoRA 微调
@cf/stabilityai/stable-diffusion-xl-base-1.0 10000/day Stable Diffusion XL 图片生成,完全免费
@cf/baai/bge-base-en-v1.5 10000/day BGE 嵌入模型,适合 RAG 和语义搜索
@cf/microsoft/phi-2 2k 10000/day 微软 Phi-2 小模型
@cf/mistral/mistral-7b-instruct-v0.2-lora 32k 10000/day Mistral 7B,支持 LoRA

🔑 API 免费额度

免费额度: 每天 10000 神经元(永久有效)

速率限制: 10000 requests/day

Cloudflare Workers $5/月套餐自带 Workers AI,每天 10000 神经元免费。 50+ 开源模型全部可用,含 LLM、图片生成(SD XL)、嵌入向量、语音转文字等。 API 兼容 OpenAI 格式(通过 AI Gateway),也可直接用 Workers AI binding。 推理在 Cloudflare 全球边缘网络运行,延迟极低。国内可直连。

国内用户完整注册教程

Step 1

访问 dash.cloudflare.com,登录或注册 Cloudflare 账号

Step 2

进入 Workers & Pages,订阅 $5/月 Workers Paid 套餐

Step 3

在 Workers AI 页面即可看到可用模型列表

Step 4

通过 AI Gateway 创建 API endpoint,获取 API Token

Step 5

也可在 Worker 代码中直接使用 env.AI.run() 调用

代码示例

# 方式一:通过 AI Gateway(OpenAI 兼容)
from openai import OpenAI

client = OpenAI(
    api_key="your-cloudflare-api-token",
    base_url="https://gateway.ai.cloudflare.com/v1/{account_id}/{gateway_id}"
)

response = client.chat.completions.create(
    model="@cf/meta/llama-3.1-8b-instruct",
    messages=[{"role": "user", "content": "Hello!"}],
)
print(response.choices[0].message.content)

# 方式二:REST API
import requests

response = requests.post(
    f"https://api.cloudflare.com/client/v4/accounts/{account_id}/ai/run/@cf/meta/llama-3.1-8b-instruct",
    headers={"Authorization": "Bearer your-api-token"},
    json={"messages": [{"role": "user", "content": "Hello!"}]}
)
print(response.json())

国内访问怎么样?

  • 直连:✅ 可以
  • 速度:fast
  • 国内可直连 Cloudflare 边缘网络,延迟低。Workers AI 通过 Cloudflare 全球 CDN 加速。

常见问题

Workers AI 真的免费吗?

需要 $5/月的 Workers Paid 套餐,但套餐内每天 10000 神经元是免费的。如果你已经在用 Workers,等于白送。

10000 神经元能用多少次?

取决于模型。Llama 3.1 8B 大约每次 500 token 消耗 1 神经元,每天可调用数千次。SD XL 图片生成每张约 10 神经元。

支持哪些图片生成模型?

主要是 Stable Diffusion XL Base 1.0,完全免费。适合批量生成产品图、博客配图等。

和 NVIDIA NIM 比怎么样?

NVIDIA NIM 模型更多更强(100+ 模型含 DeepSeek V3.2、Kimi K2.5 等),但 Workers AI 的优势是边缘部署、延迟低、和 Cloudflare 生态深度集成。

📖 相关教程

🔄 相似厂商

🐑 相关羊毛

总结:谁应该用 Cloudflare Workers AI?

如果你需要API 免费额度、国际一流水平的 AI 服务,Cloudflare Workers AI 值得一试。 想省钱?通过 openllmapi.com 一个 Key 调用 Cloudflare Workers AI 和其他 30+ 家模型,官方价 5-7 折。

category.api对话图片category.embedding apiedgeimageembeddingfreecloudflare
🐑 小羊助手