V4 Pro 2.5折延长
DeepSeek宣布将其V4 Pro模型的2.5折特价优惠延长至2026年5月31日。该优惠适用于所有API调用,为用户提供大幅折扣的模型访问权限。这是开发者以低成本体验高性能模型的绝佳机会。
AI DEAL COLLECTION
集中整理注册送额度、免费调用、OpenAI 兼容 API 和开发者可直接测试的 AI API 羊毛。
集中整理注册送额度、免费调用、OpenAI 兼容 API 和开发者可直接测试的 AI API 羊毛。 适合想快速比较免费额度、领取门槛和可用替代方案的开发者、独立开发者和 AI 工具用户。
yangmao.ai 会通过自动化数据管道和人工抽查更新免费额度、到期时间、领取条件和可访问性;领取前仍建议查看官方页面。
优先查看同页的替代平台、OpenAI 兼容 API、国内可用入口或长期免费方案,避免只依赖单一供应商。
DeepSeek宣布将其V4 Pro模型的2.5折特价优惠延长至2026年5月31日。该优惠适用于所有API调用,为用户提供大幅折扣的模型访问权限。这是开发者以低成本体验高性能模型的绝佳机会。
DeepSeek V4 Pro 官方限时 75% API 折扣,适合收录“DeepSeek promo / API discount / China-accessible AI API”搜索资产。注意这不是免费额度;免费赠送额度未在本轮官方 docs 中确认。
DeepSeek 公布 R1 模型 API 定价,输入 $0.14/百万 token,输出 $0.28/百万 token,价格极具竞争力。
新注册用户赠送500万token免费额度,支持 DeepSeek V3 模型,国内直接使用,无需翻墙。
Groq 将免费层速率限制提升至每分钟 60 次请求,适合开发测试。
Hugging Face 推出免费推理 API,支持多种开源模型,无需信用卡,每月提供 30,000 次免费推理请求。
新注册用户赠送 €10 API 额度,可用于 Mistral Large 等模型,支持国内邮箱注册,需绑定国际信用卡。
OpenAI宣布GPT-4.1 API大幅降价,输入价格降至$2/百万token,输出价格降至$8/百万token,相比GPT-4o更具性价比,适合大规模API调用。
OpenAI宣布GPT-4.1 API大幅降价,输入价格降至$2/1M tokens,输出价格降至$8/1M tokens,相比GPT-4o更具性价比。
OpenAI 宣布 GPT-4o mini API 价格大幅下调,输入价格降至 $0.15/百万 token,输出价格降至 $0.60/百万 token,为开发者提供更具性价比的 AI 服务。
新注册用户可获 $5 API 额度,用于体验 o3-mini 模型,有效期30天,支持国内信用卡注册。
SiliconFlow 新用户注册即送 2000 万 token 免费额度,支持多种模型。
SiliconFlow旗下SiliconCloud为新用户提供14天免费体验,赠送2000万token,覆盖平台所有模型。
SiliconCloud为新注册用户提供14元代金券,可用于API调用,有效期30天。
模拟Gemini CLI、Antigravity、Codex、Grok和Kiro客户端请求,兼容OpenAI API。每天支持数千次Gemini模型请求,内置Kiro中的Claude模型免费使用。通过API轻松连接任何客户端,让AI开发更高效!
模拟Gemini CLI、Antigravity、Codex、Grok和Kiro客户端请求,兼容OpenAI API。支持每天数千次Gemini模型请求,内置Kiro中的Claude模型免费使用。通过API轻松连接任何客户端,让AI开发更高效!
Anthropic for Startups 是官方企业/创业公司向免费 API credits 和 priority rate limits 申请的高置信线索,但不是无门槛注册送额度。适用对象是与 Anthropic VC partners 合作的 venture-backed startups;金额未公开,必须以官方审核和发放为准。
Anyscale API 当前记录有免费试用:$10 free credits;速率限制:30 RPM。
Anyscale 当前记录有免费额度:按额度。适合先试用再决定是否升级。
Anyscale 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:$10 free credits。适合直接替换 SDK base_url 做低成本测试。
百川智能为新注册用户提供 100 万 token 免费 API 额度,支持 Baichuan4 系列模型,国内直连,无需科学上网。
百川智能为 Baichuan4 模型提供新用户注册即送100万token免费API额度,支持中文优化,国内直接访问,适合开发者快速集成。
注册百川智能开放平台即送 100 万 token,支持 Baichuan4 和 Baichuan3-Turbo 模型,国内直连,无需海外支付方式。
百川智能 API 当前记录有免费试用:500万 tokens;速率限制:5 RPM。
百川智能 当前记录有免费额度:无明确限制。适合先试用再决定是否升级。
百川智能 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:500万 tokens。适合直接替换 SDK base_url 做低成本测试。
百度千帆大模型平台为新用户提供100万Token免费调用额度(支持ERNIE 4.0、ERNIE Speed等),另赠50元体验金。国内开发者可直接使用百度账号注册,API兼容OpenAI格式,迁移成本低。
百度千帆大模型平台为新用户提供 100 万 token 的免费调用额度,支持 ERNIE-Bot、ERNIE-Bot-turbo 等模型,国内直接访问,注册即用,无需绑定支付方式。
百度千帆平台为新用户提供 ERNIE-Bot 系列模型免费调用额度,包含 100 万 tokens,支持 API 调用,国内直接可用,无需海外支付方式。
百度千帆平台近期调整免费政策,ERNIE-Bot、ERNIE-Bot-Turbo 等模型每日免费调用次数提升至 1000 次,注册即享,无需绑定银行卡,国内开发者友好。
百度千帆大模型平台为新用户提供 200万 token 免费额度,支持 ERNIE-Bot、ERNIE-Bot-turbo 等模型,国内网络直接使用,注册即送。
百度千帆大模型平台为新用户提供100万 token 免费额度,适用于 ERNIE 3.5 和 ERNIE 4.0 模型,支持文本生成、对话等场景。国内直接访问,无需科学上网,注册即用。
Cerebras API 当前记录有免费试用:1M tokens/day;速率限制:30 RPM / 60K TPM / 1M TPD。
Cerebras 使用自研 WSE 芯片,推理速度全球最快(2000+ tokens/s,比 GPU 快 20 倍)。免费层每天 100 万 token,30 RPM,无需信用卡。 支持模型:Llama 3.3 70B、Llama 3.1 8B、Qwen 3.5 等。OpenAI 兼容格式,一行代码切换。 适合对延迟敏感的场景:实时对话、流式输出、Agent 工具调用。速度是 Groq 的竞争对手,但每天额度更大(100 万 vs Groq 的 RPD 限制)。
Cerebras 当前记录有免费额度:100 万 tokens/天。适合先试用再决定是否升级。
Cerebras 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:1M tokens/day。适合直接替换 SDK base_url 做低成本测试。
ChatGPT (OpenAI) 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:$0。适合直接替换 SDK base_url 做低成本测试。
Anthropic API API 当前记录有免费试用:$5;速率限制:5 RPM。
2026年5月21日,Claude.ai 出现高错误率,导致用户无法正常使用服务。该问题由官方状态更新确认,目前仍在持续影响中。建议用户暂时使用其他替代工具或等待官方修复。此事件不涉及任何优惠或新功能,仅为服务中断通知。
2026年5月12日,Claude 官方发布状态更新,确认 Claude Sonnet 4.6 和 Haiku 4.5 出现错误率升高问题。该问题影响部分用户请求,官方正在积极修复中。目前没有提供免费额度或其他补偿方案。建议用户关注官方状态页面获取最新进展。
Cloudflare Workers AI API 当前记录有免费试用:每天 10000 神经元(永久有效);速率限制:10000 requests/day。
Cloudflare Workers AI 当前记录有免费额度:每天 10000 次免费调用。适合先试用再决定是否升级。
Cloudflare Workers $5/月套餐内置 Workers AI,每天 10000 次免费 AI 调用(以神经元计量),永久有效。 支持 50+ 开源模型: - LLM:Llama 3.1 8B、Llama 3.3 70B、Gemma、Mistral 7B、Phi-2 - 图片生成:Stable Diffusion XL(完全免费!) - 嵌入向量:BGE Base/Large(适合 RAG 和语义搜索) - 语音转文字:Whisper 亮点: - 永久有效,不会过期 - 推理在 Cloudflare 全球 300+ 边缘节点运行,延迟极低 - 国内可直连,无需代理 - 支持 OpenAI 兼容格式(通过 AI Gateway) - 超出免费额度后按量计费,不会突然断服务 - 如果你已经在用 Cloudflare Workers,这基本是白送的 适合轻量 AI 场景:博客辅助写作、内容标签生成、文本摘要、嵌入向量、产品图生成等。
Cloudflare Workers AI 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:每天 10000 神经元(永久有效)。适合直接替换 SDK base_url 做低成本测试。
Cohere将Command R+和Command R API价格降低50%,新模型Command R7B定价更低。
Cohere API 当前记录有免费试用:1000 calls/month;速率限制:Trial rate limits。
Cohere 当前记录有免费额度:1000 次/月(Trial Key)。适合先试用再决定是否升级。
新用户注册 Cohere 平台即获 $10 免费 API 额度,可用于 Command R+、Embed 等模型,支持 RAG 和分类任务,国内需科学上网。
Cohere 提供免费 Trial API Key,每月 1000 次调用,覆盖旗下所有模型: - Command R+:顶级 RAG 和对话模型 - Rerank:文档重排序,RAG 必备 - Embed:文本嵌入向量,支持多语言 无需信用卡,每月自动重置。适合个人开发者和 RAG 项目原型验证。注意:Trial Key 不允许用于生产环境。
Cohere 提供每月 100 万 token 免费额度,支持 Command R+、Embed 等模型,API 稳定,国内需科学上网,适合 RAG 和文本生成场景。
Cohere 近期将免费试用额度从 40 万 token 提升至每月 100 万 token,支持 Command R、Embed 等模型 API,注册即享,国内需科学上网访问。
扣子 (字节跳动) API 当前记录有免费试用:Free tier;速率限制:Varies。
扣子 (字节跳动) 当前记录有免费额度:无明确限制。适合先试用再决定是否升级。
Databricks 宣布在其企业代理工作流中集成 OpenAI 的 GPT-5.5 模型。该模型专为复杂任务设计,支持多步骤推理和自动化操作。企业用户可通过 Databricks 平台直接调用,无需额外配置。此次更新标志着 OpenAI 模型在企业级应用中的进一步扩展。
DeepSeek 官方文档确认 API 并发默认限制之外存在 capacity expansion request:需要更高并发的账号可提交业务需求,由 DeepSeek 匹配适当并发,并且扩容没有额外费用。适合需要 DeepSeek V4 Pro / V4 Flash 更高并发的团队或企业;这不是免费 token 额度,也不是自动开通。
DeepSeek 为新注册用户提供 500 万 token 免费 API 额度(含对话和代码模型),支持国内直接访问,无需海外信用卡。
注册即送 500 万 token,支持 DeepSeek-V2 和 DeepSeek-Coder 模型,兼容 OpenAI API 格式,国内直连可用,无信用卡要求。
DeepSeek 为新注册用户提供 500 万 token 的免费 API 额度(含输入和输出),支持 DeepSeek-V2 等模型,国内可直接访问,无需海外信用卡。
DeepSeek API 当前记录有免费试用:$5;速率限制:2 RPM。
DeepSeek 为新注册用户提供 500 万免费 tokens,支持 DeepSeek-V2 和 DeepSeek-Coder 模型,API 兼容 OpenAI 格式,国内可直接访问,无需海外信用卡。
DeepSeek 为新注册用户提供 500万 token 的免费 API 调用额度,支持 DeepSeek-V2 和 DeepSeek-Coder 模型,国内可直接访问,无需海外信用卡。
DeepSeek 提供每日 50 次免费推理(V3 + R1 模型),注册即送 $5 API 额度。R1 推理模型在数学和代码方面表现优异,是目前性价比最高的免费 AI 之一。
DeepSeek将免费用户每日对话次数限制从50次提升至100次,为用户提供更多免费使用额度。
DeepSeek 当前记录有免费额度:50次/天。适合先试用再决定是否升级。
DeepSeek继续提供免费API额度,新用户注册即送500万token,无需付费即可开始使用。
DeepSeek 为新注册用户提供 500 万 token 的免费额度(含输入和输出),可用于 DeepSeek-V3 和 DeepSeek-R1 模型 API,有效期 30 天,支持国内直接访问,无需翻墙。
DeepSeek 为新注册用户提供 500 万 Token 免费额度,可用于 DeepSeek-V2 和 DeepSeek-Coder 系列模型 API 调用,支持文本生成与代码补全,国内直接访问,无需翻墙。
DeepSeek 为新注册用户提供500万Token免费额度,可用于其最新大模型API调用,支持文本生成、代码编写等,国内可直接访问注册,无需海外信用卡。
DeepSeek 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:$5。适合直接替换 SDK base_url 做低成本测试。
新注册 DeepSeek 平台即赠送 500 万 token 免费额度,可用于调用 DeepSeek-V2 等模型 API,支持国内网络直接使用,无需海外信用卡。
DeepSeek-V3输入价格降至$0.27/百万token,输出价格降至$1.10/百万token,适用于所有API用户。
DeepSeek-V4 正式发布,带来百万级Token上下文窗口,显著提升长文本处理能力。该模型面向Agent应用优化,支持更复杂的多步骤推理和工具调用。开发者可通过API免费使用,无需额外付费。这是目前开源模型中上下文长度最长的之一,适合文档分析、代码库理解等场景。
DeepSeek V4 Pro 模型的价格优惠将于2026年5月31日结束,此前享受的2.5折优惠将调整为原定价的1/4。这意味着价格有所上调,但相比原价仍有一定折扣。用户需注意价格变动,合理规划使用成本。
豆包 (字节跳动) API 当前记录有免费试用:50万 tokens;速率限制:5 RPM。
豆包 (字节跳动) 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:50万 tokens。适合直接替换 SDK base_url 做低成本测试。
ElevenLabs API 当前记录有免费试用:10K chars/month;速率限制:Varies。
ElevenLabs 当前记录有免费额度:10000 字符/月。适合先试用再决定是否升级。
文心一言 (百度) API 当前记录有免费试用:Free tier;速率限制:5 RPM。
文心一言 (百度) 当前记录有免费额度:无明确限制。适合先试用再决定是否升级。
fal.ai API 当前记录有免费试用:Promotional credits;速率限制:N/A。
fal.ai 当前记录有免费额度:注册送 credits。适合先试用再决定是否升级。
Fireworks AI 提供每日 100 万 token 免费额度,支持 Llama 3、Mixtral、Gemma 等主流开源模型。API 兼容 OpenAI 格式,国内可直连,适合原型开发和轻量应用。
提供高速推理 API,支持 Llama、Qwen 等开源模型。新用户有每日免费的 token 额度,适用于开发和测试。
Fireworks AI API 当前记录有免费试用:$1 free credits;速率限制:600 RPM。
Fireworks AI 当前记录有免费额度:600 RPM。适合先试用再决定是否升级。
Fireworks AI 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:$1 free credits。适合直接替换 SDK base_url 做低成本测试。
FLUX (Black Forest Labs) API 当前记录有免费试用:Free via platforms;速率限制:Varies。
Gemini API 官方免费层适合个人开发者、小项目和原型验证;具体免费速率限制会随模型、项目和 billing tier 变化,需在 AI Studio 查看当前项目限额。
Gemini (Google) 当前记录有免费额度:无明确限制。适合先试用再决定是否升级。
GLHF.chat 提供 Llama、Mistral 等开源模型的免费 GPU 推理服务,注册即送每月 25 美元额度,无需绑定信用卡。支持国内网络访问,适合低成本运行大模型。
Google AI (Gemini) API 当前记录有免费试用:免费 API 无需信用卡;速率限制:15 RPM (Flash)。
Google AI (Gemini) 当前记录有免费额度:Gemini 免费版无限使用。适合先试用再决定是否升级。
Google 最新 Gemini 2.5 Pro 模型提供免费 API 层,每分钟最多2次请求,无需付费即可体验长上下文推理能力,适合开发测试和小型应用。
Google 调整了 Gemini 免费层的额度,Gemini 2.5 Flash 模型在 AI Studio 中免费提供,速率限制为每分钟 30 次请求。
Google AI Studio免费层现已支持Gemini 2.5 Flash模型,用户每日可享受免费配额,无需付费即可使用该模型进行开发与测试。
Gemini 2.5 Flash输入价格降至$0.15/百万token,输出价格降至$0.60/百万token,大幅降低使用成本。
Gemini 2.5 Flash输入价格$0.15/百万token,输出$0.60/百万token,性价比极高。
Google将Gemini API免费层速率限制提升至每分钟30次请求,支持Gemini 2.0 Flash模型,适合开发者和个人项目使用。
Gemini API / AI Studio 官方 no-card 免费层新增可抓入口:除 Gemini API Free Tier 免费输入/输出 token 外,Google I/O 2026 官方 Blog 还确认 AI Studio 新手可免信用卡、零成本把前两个 app 部署到 Google Cloud。注意:生产环境、更高限额或已启用 billing 项目仍按官方 Cloud Run / Paid Tier 规则走。
Google Gemini API 提供免费层,支持 Gemini 1.5 Pro 和 Flash 模型,每分钟最多 60 次请求,无需付费即可使用多模态能力,国内需代理访问。
Google Gemini API 提供免费层级,每分钟最多60次请求,支持 Gemini 1.5 Flash 和 Gemini 1.5 Pro 模型,国内开发者可通过代理或直接访问(部分地区可用)。无需绑定信用卡即可开始使用。
Google将Gemini免费层上下文窗口从32k提升至100万token,并增加每日请求次数,大幅提升免费用户的使用体验。
Google宣布关闭其免费搜索索引,这意味着依赖网络搜索的AI应用和开发者将无法再免费获取实时搜索结果。Cloudflare等流量防御服务也在加强AI爬虫的拦截,进一步加剧了网络搜索的困难。用户需要寻找替代方案,如使用Bing API、DuckDuckGo或自建爬虫,但成本和技术门槛可能上升。
OpenAI于2026年5月11日发布GPT-5.5及专为网络安全设计的GPT-5.5-Cyber模型。该模型系列强化了可信访问能力,适用于安全分析、威胁检测和自动化响应等场景。新模型在推理准确性和安全性上有所提升,为企业和安全团队提供更可靠的AI助手。
OpenAI 发布了 GPT-5.5 Instant 模型,这是 GPT 系列的最新迭代版本。该模型针对低延迟响应进行了优化,适用于需要即时交互的应用场景。用户可以通过 OpenAI API 直接调用,无需额外申请。具体定价和免费额度信息尚未公布,建议关注官方文档更新。
OpenAI 发布了 GPT-5.5 系统卡,标志着新一代模型的到来。该模型在推理、编码和多模态能力上均有显著提升。具体定价和免费额度信息尚未公布,但预计将延续 GPT 系列的分层定价策略。用户可通过 OpenAI API 或 ChatGPT 体验新模型。
OpenAI正式发布GPT-5.5及GPT-5.5-Cyber模型,这是GPT系列的最新升级版本。GPT-5.5-Cyber专为网络安全领域设计,提供更强大的可信访问控制功能,适用于威胁检测、漏洞分析等场景。该模型通过增强的安全机制,帮助企业更好地保护敏感数据和系统。
Grok (xAI) API 当前记录有免费试用:$25/月;速率限制:Varies。
Grok (xAI) 当前记录有免费额度:有限次数/天。适合先试用再决定是否升级。
xAI 的 Grok 每月送 $25 API 额度,自动重置。支持 Grok-2 等模型,OpenAI 兼容格式。是目前每月免费额度最高的 AI API 之一。
Grok (xAI) 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:$25/月。适合直接替换 SDK base_url 做低成本测试。
Groq 提供基于 LPU 推理引擎的免费 API,支持 Llama 3、Mixtral 等模型,每日 1440 次请求限制,速度极快。需海外邮箱注册,国内可访问但需翻墙。
Groq 提供每日100万Token免费API调用额度,基于其自研LPU芯片实现极速推理(支持Llama 3、Mixtral等模型)。注册需海外邮箱,但API国内可直连,适合低延迟场景。
Groq 提供基于 LPU 推理引擎的免费 API,支持 Llama 3、Mixtral 等模型,每天最多 1440 次请求,国内可直连,适合低延迟推理测试。
Groq API 当前记录有免费试用:Free tier(永久免费);速率限制:30 RPM / 6000 TPM。
Groq 是今天最值得补的高速推理羊毛之一:免费层可直接测试 Llama / Mixtral / Gemma 等模型,接口兼容 OpenAI SDK。适合做 AI Agent、RAG 摘要、低延迟聊天原型。国内访问稳定性需要自行确认,必要时可用 API 中转。
Groq 提供免费 API 额度,支持 Llama 3、Mixtral 等开源模型,推理速度极快,每日有限免费调用次数,注册即用,国内需科学上网。
Groq 使用自研 LPU(Language Processing Unit)推理芯片,提供业界最快的 AI 推理速度。 免费模型列表: - Llama 3.3 70B Versatile — 6000 TPM / 30 RPM - Llama 4 Scout 17B — 6000 TPM / 30 RPM - Llama 4 Maverick 17B — 6000 TPM / 30 RPM - Mixtral 8x7B — 5000 TPM / 30 RPM - Gemma 2 9B — 15000 TPM / 30 RPM - DeepSeek R1 Distill Llama 70B — 6000 TPM / 30 RPM 亮点: - 速度比 GPU 方案快 10 倍以上,Llama 3.3 70B 可达 300+ token/秒 - API Key 以 gsk_ 开头,兼容 OpenAI 格式 - 不限总量,只限速率 - 需要代理访问(国内可通过 openllmapi.com 中转)
Groq 将免费套餐的每日 API 请求上限从 500 次提升至 1000 次,支持 Llama 3、Mixtral 等开源模型,国内开发者可直接通过 API 调用,无需绑定信用卡。
Groq 使用自研 LPU(Language Processing Unit)芯片,提供全球最快的 AI 推理速度。免费层无需信用卡,日常使用完全够。 免费额度详情: - Llama 3.3 70B:30 RPM,6000 tokens/min,14400 requests/day - Llama 3.1 8B:30 RPM,20000 tokens/min - Gemma 2 9B:30 RPM,15000 tokens/min - Mixtral 8x7B:30 RPM,5000 tokens/min - 还支持 Llama 4 Scout/Maverick(新上线) 为什么 Groq 速度这么快: - 自研 LPU 芯片,专为 LLM 推理设计 - 确定性执行,没有 GPU 的内存带宽瓶颈 - Llama 3.3 70B 输出速度 300+ tokens/s(GPU 通常 30-50 tokens/s) - 首 token 延迟极低,适合实时对话和流式输出 适合场景: - 实时 AI 对话(速度是体验的核心) - Agent 工具调用(低延迟 = 更快的多步推理) - 流式输出(打字机效果极其流畅) - 需要快速迭代的原型开发 国内可直连。API 兼容 OpenAI 格式,base_url 为 https://api.groq.com/openai/v1。
Groq 当前记录有免费额度:6000 tokens/min (Llama 3.3 70B)。适合先试用再决定是否升级。
Groq免费层用户现在可以调用Llama 4 Scout和Maverick模型,有速率限制。
Groq免费层速率限制调整,部分模型每日请求上限降低,具体限制请参考官方文档。
Groq将免费层API速率限制从每分钟30次提升至60次,支持更多模型。
Groq提升免费层API速率限制,支持更多并发请求,适合开发者测试和原型开发。
Groq将免费层速率限制从每分钟30次提升至60次,支持Llama 3和Mixtral模型,适用于API调用。
Groq在其平台上部署了Meta的Llama 4 Scout和Llama 4 Maverick模型,提供免费API。
Groq 于2026年4月底上线Mixtral 8x7B免费推理服务,每日500次请求,无需信用卡,API兼容OpenAI格式,国内开发者可直接调用。
Groq 提供 Mixtral 8x7B 等模型的免费 API 访问,速率限制为每分钟30次请求,适合快速原型开发。国内需通过代理访问。
Groq 提供基于 LPU 的高速推理服务,Mixtral 8x7B 模型每日免费额度高达100万token,注册即用,国内可直接访问 API。
Groq 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:Free tier(永久免费)。适合直接替换 SDK base_url 做低成本测试。
Hugging Face API 当前记录有免费试用:Free tier;速率限制:Varies。
Hugging Face 当前记录有免费额度:按模型不同。适合先试用再决定是否升级。
Hugging Face 提供 Inference API 免费套餐,每月 3 万次调用,支持数千个开源模型(文本、图像、音频等),国内可访问但速度较慢,适合学习和实验。
Hugging Face 提供免费推理 API,可调用数千个社区模型(包括文本、图像、音频等),国内可直接访问,无需付费。
Hugging Face将Spaces免费GPU时长从每月10小时提升至20小时,用户可更长时间运行AI应用和演示。
腾讯混元 API 当前记录有免费试用:100万 tokens;速率限制:5 RPM。
腾讯混元 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:100万 tokens。适合直接替换 SDK base_url 做低成本测试。
Kimi (月之暗面) API 当前记录有免费试用:¥15 + 充 $5 送 $5;速率限制:3 RPM。
月之暗面(Moonshot AI)为 Kimi 大模型 API 新用户提供100万 token 免费额度,支持长上下文(128K),国内直接访问,无需代理。注册即送,可用于对话、文档分析等场景。
Kimi (月之暗面) 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:¥15 + 充 $5 送 $5。适合直接替换 SDK base_url 做低成本测试。
DGX Cloud Lepton (原 Lepton AI) API 当前记录有免费试用:$10 free credits;速率限制:10 RPM。
DGX Cloud Lepton (原 Lepton AI) 当前记录有免费额度:10M tokens/day。适合先试用再决定是否升级。
DGX Cloud Lepton (原 Lepton AI) 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:$10 free credits。适合直接替换 SDK base_url 做低成本测试。
LM Studio API 当前记录有免费试用:Unlimited;速率限制:Local。
LM Studio 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:Unlimited。适合直接替换 SDK base_url 做低成本测试。
万量引擎 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:按量付费。适合直接替换 SDK base_url 做低成本测试。
MiniMax (稀宇科技) API 当前记录有免费试用:¥15;速率限制:Varies。
MiniMax (稀宇科技) 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:¥15。适合直接替换 SDK base_url 做低成本测试。
Mistral AI 于2026年4月更新免费政策,Le Chat 平台每月提供100万token免费额度,支持Mistral Large 2模型,国内可直连。
Mistral AI 的 Le Chat 聊天应用提供免费无限对话,支持 Mistral Large 等模型,国内可直接访问网页版,无需注册即可使用基础功能。
Mistral AI API 当前记录有免费试用:Free tier;速率限制:1 RPM。
Mistral AI 为新用户提供 500 万 token 免费 API 额度,支持 Mistral Large、Small 等模型,国内可注册但需海外邮箱。
Mistral AI 的官方免费 API 入口是 Experiment plan:可免费评估和做原型,但速率限制较低,生产或更高额度需升级 Scale plan。
Mistral AI 当前记录有免费额度:无明确限制。适合先试用再决定是否升级。
Mistral AI 的官方免费 API 入口是 Experiment plan:可免费评估和做原型,但速率限制较低,生产或更高额度需升级 Scale plan。
Mistral AI 的 Le Chat 平台提供免费层,支持无限次对话、文件上传(图像、PDF、Word、Excel)和网络搜索,无需付费。国内可直接访问网页版。
Mistral AI 推出的 Le Chat 聊天助手提供每日100次免费对话额度,使用自家 Mistral Large 模型,支持中文。可通过网页或 API 使用,注册即享,无需付费。国内可正常访问。
Mistral AI 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:Free tier。适合直接替换 SDK base_url 做低成本测试。
注册月之暗面开放平台即送 1500 万 token,支持 Kimi 长上下文模型(128K),国内直连,适合长文本处理任务。
月之暗面(Moonshot AI)为新注册用户提供 100 万免费 tokens,支持长上下文模型,API 兼容 OpenAI 格式,国内直接使用。
月之暗面 Moonshot 为新注册用户提供 150万 token 的免费 API 额度,支持 Moonshot-v1 模型,国内可直接访问,适合长文本处理。
月之暗面 Kimi 大模型为新注册开发者提供 500 万 token 的免费 API 调用额度,支持长上下文模型,国内网络可直接使用,适合构建对话和文本处理应用。
Novita AI API 当前记录有免费试用:$0.50 free credits;速率限制:60 RPM。
Novita AI 当前记录有免费额度:按额度。适合先试用再决定是否升级。
Novita AI 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:$0.50 free credits。适合直接替换 SDK base_url 做低成本测试。
NVIDIA Build (NIM API) API 当前记录有免费试用:无限制(已取消额度限制);速率限制:40 RPM(可申请提升到 200 RPM)。
NVIDIA Build (NIM API) 当前记录有免费额度:无限制(40 RPM 速率限制)。适合先试用再决定是否升级。
NVIDIA Build (NIM API) 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:无限制(已取消额度限制)。适合直接替换 SDK base_url 做低成本测试。
OctoAI API 当前记录有免费试用:$10 free credits;速率限制:60 RPM。
OctoAI 当前记录有免费额度:按额度。适合先试用再决定是否升级。
OctoAI 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:$10 free credits。适合直接替换 SDK base_url 做低成本测试。
Ollama API 当前记录有免费试用:Unlimited;速率限制:Local。
Ollama 当前记录有免费额度:无限制(本地运行)。适合先试用再决定是否升级。
Ollama 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:Unlimited。适合直接替换 SDK base_url 做低成本测试。
OpenAI API 当前记录有免费试用:$5;速率限制:3 RPM (free tier)。
OpenAI 当前记录有免费额度:ChatGPT 免费版无限使用。适合先试用再决定是否升级。
OpenAI宣布GPT-4.1 API大幅降价,输入价格降至每百万token仅$2,输出价格降至每百万token仅$8,相比GPT-4o降低约26%,大幅降低开发者调用成本。
OpenAI推出GPT-4.1系列API,相比GPT-4o价格降低约26%,输入仅$2/百万token,输出$8/百万token。GPT-4.1 mini和nano版本价格更低,适合不同场景需求。
OpenAI宣布GPT-4.1 API大幅降价,输入价格降至每百万token 2美元,输出价格降至每百万token 8美元,相比GPT-4o降低约50%,大幅降低开发者调用成本。
OpenAI宣布GPT-4.1 API大幅降价,输入价格降至每百万token仅2美元,输出价格降至每百万token仅8美元,相比GPT-4o降低了26%,为开发者提供更具性价比的AI能力。
OpenAI宣布GPT-4.1系列API降价,相比GPT-4o输入价格降低26%,输出价格降低50%,GPT-4.1 mini和nano价格更低。
OpenAI宣布GPT-4.1 API大幅降价,输入价格降至$2/百万token,输出价格降至$8/百万token,相比GPT-4o便宜26%,大幅降低开发者使用成本。
OpenAI宣布GPT-4.1 API大幅降价,输入价格降至每百万token 2美元,输出价格降至每百万token 8美元,相比GPT-4o更具性价比,适合大规模推理和生成任务。
OpenAI宣布GPT-4.1系列API降价,输入价格降至每百万token $2,输出价格降至每百万token $8,相比GPT-4o更具性价比。
GPT-4.1输入价格$2/百万token,输出$8/百万token,比GPT-4o低约26%。
OpenAI 宣布 GPT-4.1 系列模型新增通过 API 调用代码解释器的功能,使开发者能够在应用中直接利用代码解释器进行编程辅助、数据处理和分析,显著提升模型在编码和数据分析场景下的实用性。
OpenAI 于2026年4月将GPT-4o免费层从每日10次提升至50次,无需绑定支付方式即可使用,支持文本和图像输入。
OpenAI 为 GPT-4o-mini 模型提供免费层,注册后每日可免费调用约100次,适合轻量级应用和测试。国内需通过代理访问。
OpenAI 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:$5。适合直接替换 SDK base_url 做低成本测试。
OpenAI对GPT-4.1系列进行了Structured Outputs功能改进,提升了JSON模式的可靠性和性能,使开发者能够更稳定地获取结构化输出。
OpenRouter API 当前记录有免费试用:Free models;速率限制:20 RPM。
新注册用户可获得少量免费额度,用于体验其聚合的众多模型API(如 Claude、GPT、Llama 等)。额度有限,适合初步测试。
OpenRouter 为新用户提供 $1 免费额度,同时提供多个永久免费模型(如 Mistral 7B、Llama 3 8B 等),支持统一 API 调用多种模型,国内需科学上网。
OpenRouter 聚合多模型 API,新注册用户赠送 $1 免费额度,可用于 GPT-4、Claude 3.5、Gemini 等模型,国内可访问,无需信用卡。
OpenRouter 当前记录有免费额度:按模型不同。适合先试用再决定是否升级。
OpenRouter 为新注册用户提供 $1 免费额度,可用于调用多种开源和商业模型(如 GPT-4、Claude、Llama 等),国内需代理访问。
OpenRouter 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:Free models。适合直接替换 SDK base_url 做低成本测试。
Perplexity AI 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:$0。适合直接替换 SDK base_url 做低成本测试。
Perplexity Pro 提供1个月免费试用,包含无限次搜索、高级模型(GPT-4、Claude 3等)和文件上传功能。需绑定支付方式,试用结束后自动续费(可取消)。国内可访问,但需科学上网。
通义千问 (阿里) API 当前记录有免费试用:7000 万 tokens(新用户一次性);速率限制:按模型不同。
阿里通义千问 Qwen3.6-Plus 是国产编程最强模型,新用户注册百炼平台送 7000 万免费 token(一次性)。编程能力接近 Claude Sonnet 4.6,定价仅 2 元/百万 token。
通义千问 (阿里) 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:7000 万 tokens(新用户一次性)。适合直接替换 SDK base_url 做低成本测试。
Replicate API 当前记录有免费试用:Free tier;速率限制:Varies。
Replicate 平台新用户注册即送$10免费额度,可用于运行多种开源模型(如Llama 3、Stable Diffusion),无需绑定信用卡,国内可注册使用。
平台托管大量 AI 模型,新用户注册可获得少量免费 GPU 时间,用于运行各种开源模型。超出后需付费。
Replicate 提供每月 50 次免费推理额度,支持大量开源模型(如 Stable Diffusion、Llama、Whisper),国内需代理访问,适合模型测试和小型项目。
Replicate 当前记录有免费额度:按额度。适合先试用再决定是否升级。
Replicate 为新用户提供 $5 免费额度,可运行多种 AI 模型(图像生成、文本、语音等),国内可注册但需绑定支付方式。
SambaNova Cloud 提供全球唯一的 LLaMA 3.1 405B 免费 API 调用。 核心优势: - LLaMA 3.1 405B(4050 亿参数)完全免费 — 这是目前最大的免费可用开源模型 - 全球唯一提供 405B 免费调用的平台,没有之一 - 自研 RDU(Reconfigurable Dataflow Unit)芯片加速,推理速度极快 - 30 RPM 速率限制,但不限总量 — 一天调几千次都行 - API Key 以 sn- 开头,兼容 OpenAI 格式 支持模型: - LLaMA 3.1 405B(旗舰,复杂推理首选) - Llama 3.3 70B(性价比之王) - DeepSeek R1/V3(671B MoE) - Qwen 2.5 72B - 更多模型持续上线 405B vs 70B 的差距: - 复杂推理能力显著提升(数学、逻辑、多步推理) - 长文本理解更强(128K 上下文) - 代码生成质量更高 - 指令遵循更精准 需要代理访问(国内可通过 openllmapi.com 中转)。适合需要大参数模型能力但预算有限的开发者。
SambaNova API 当前记录有免费试用:Free tier(永久免费);速率限制:30 RPM。
SambaNova 当前记录有免费额度:30 RPM(不限总量)。适合先试用再决定是否升级。
SambaNova 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:Free tier(永久免费)。适合直接替换 SDK base_url 做低成本测试。
商汤 Token Plan 公测提供 DeepSeek-V4-Flash 免费 API 入口线索,国内开发者可用它做低成本文档处理、摘要和简单 Agent 子任务测试。当前信息来自公开文章和平台入口,额度与限制需二次验证。
正规运营商低价 AI Token 套餐线索,适合做每百万 token 成本实测。当前信息来自 2026-05-16 财联社截图:1 元约 25 万额度点、话费支付、可接入多种大模型。上线前请按最低档验证额度点换算、支持模型和限速。
SiliconFlow为新用户提供14天免费API额度,支持多种主流模型,适合开发者快速体验和测试。
SiliconFlow 为新注册用户提供 2000 万 token 免费额度,支持 Llama、Qwen、DeepSeek 等多个开源模型,兼容 OpenAI API 格式,国内可直连,注册即送。
硅基流动 (SiliconFlow) API 当前记录有免费试用:¥14;速率限制:Varies。
SiliconFlow 提供长期免费API额度,每月200万Token调用量,另赠送15元体验金可用于更高性能模型。支持多种开源模型(如Qwen、Llama、ChatGLM等),国内直连,注册即用。
SiliconCloud新增多个免费模型,包括DeepSeek-V3和Qwen2.5系列,用户可免费调用。
硅基流动提供 14 个开源模型的完全免费 API,包括 Qwen、DeepSeek、Llama 等。国内直连,速度快,OpenAI 兼容格式。是国内开发者最方便的免费 AI API。
注册 SiliconFlow 平台即送 2000 万 token,支持 Llama、Qwen、DeepSeek 等多种开源模型,国内直连,提供 OpenAI 兼容 API。
硅基流动 (SiliconFlow) 当前记录有免费额度:按模型不同。适合先试用再决定是否升级。
SiliconFlow为新注册用户提供$10 API免费额度,有效期30天。
SiliconFlow新用户注册即送14元(约$2)API代金券,可用于DeepSeek等模型。
SiliconFlow旗下SiliconCloud为新用户提供2000万token免费额度,支持多款模型,活动持续进行。
SiliconCloud为新注册用户提供2000万token免费额度,支持多模型调用,适用于各类AI应用开发。
SiliconFlow新用户注册即送200万token免费额度,可用于多种模型,无门槛使用。
SiliconCloud新用户注册即送14元代金券,可用于调用多种模型API,覆盖主流开源模型。
硅基流动 (SiliconFlow) 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:¥14。适合直接替换 SDK base_url 做低成本测试。
讯飞星火 API 当前记录有免费试用:200万 tokens;速率限制:5 RPM。
讯飞星火 当前记录有免费额度:无明确限制。适合先试用再决定是否升级。
讯飞星火 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:200万 tokens。适合直接替换 SDK base_url 做低成本测试。
阶跃星辰 API 当前记录有免费试用:¥10;速率限制:5 RPM。
阶跃星辰为新注册用户提供 100万 token 免费 API 额度,支持 Step-2 万亿参数大模型,国内直连,注册即用,无需复杂审核。
阶跃星辰 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:¥10。适合直接替换 SDK base_url 做低成本测试。
阶跃星辰 Step-2 大模型为新注册用户提供 100 万 token 的免费 API 调用额度,支持多模态和文本生成,国内直连,适合快速体验和开发测试。
腾讯混元大模型为开发者提供每月 100 万 token 的免费 API 调用额度,支持文本生成、对话等能力,国内开发者可直接使用微信/QQ 登录,无需绑定信用卡。
天工 AI (昆仑万维) API 当前记录有免费试用:Free tier;速率限制:Varies。
Together AI 为新用户提供 $25 免费 API 额度,可用于调用 Llama、Mixtral、Stable Diffusion 等开源模型,支持 OpenAI 兼容接口,国内需代理访问。
Together AI 为新用户提供每月 $25 免费额度,支持 Llama、Mistral、DeepSeek 等多种开源模型,国内需代理,适合模型微调和推理测试。
新注册用户获得 $25 免费 API 额度,支持 Llama 3、Mixtral、Falcon 等多种开源模型,兼容 OpenAI 格式,国内需代理访问,注册无需信用卡。
Together AI 新注册用户获得 $5 免费额度,可调用 200+ 开源模型 API。 亮点: - $5 免费额度,足够数万次 API 调用 - FLUX 图片生成模型完全免费,不消耗额度(这是隐藏福利!) - 支持 Llama 3.3 70B/405B、Mixtral 8x22B、Qwen 2.5、DeepSeek V3/R1 等 - Serverless 和 Dedicated 两种部署模式 - OpenAI 兼容格式,一行代码切换 - 推理速度快,支持 JSON Mode、Function Calling FLUX 免费图片生成是最大亮点: - FLUX.1 Schnell(快速版,1-4 步出图) - FLUX.1 Dev(高质量版) - 完全免费,不限次数,不消耗 $5 额度 - 质量媲美 Midjourney,适合批量生成产品图、营销素材 适合需要高质量开源模型 API + 免费图片生成的开发者。
Together AI 为新用户提供 $25 免费 API 额度,支持 200+ 开源模型。 最大亮点:FLUX.1 Schnell Free 图片生成完全免费! - 不消耗任何额度 - 无限使用 - 高质量 AI 图片生成 - 这是目前唯一提供免费高质量 AI 图片生成 API 的平台 LLM 模型支持: - Llama 3.3 70B Turbo、Llama 4 Maverick - DeepSeek V3、Mixtral 8x22B - 以及 200+ 其他开源模型 API Key 以 together- 开头,兼容 OpenAI 格式。 base_url: https://api.together.xyz/v1 需要代理访问(国内可通过 openllmapi.com 中转)。
Together AI API 当前记录有免费试用:$5(注册赠送);速率限制:Varies by model。
Together AI 当前记录有免费额度:按额度($5 注册赠送)。适合先试用再决定是否升级。
Together AI 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:$5(注册赠送)。适合直接替换 SDK base_url 做低成本测试。
useknockout 是一个开源项目,提供免费的状态最优(SOTA)背景去除和超分辨率API,作为remove.bg和Topaz的替代方案。该项目采用MIT开源协议,运行在Modal平台上,用户可以在Modal的免费额度内使用。适合需要图像背景去除或超分辨率处理的开发者和企业。
UUSEC WAF 是一款业界领先的免费、高性能 Web 应用防火墙与 API 安全网关,融合 AI 与语义分析技术,支持 SQL 注入、XSS、DDoS 防护、数据脱敏、RASP 等功能,兼容 ModSecurity 规则,适合企业级应用安全防护。
Vidu API 当前记录有免费试用:$1;速率限制:N/A。
字节跳动火山引擎提供的豆包大模型 API,新用户通常有一定量的免费 tokens 额度,国内可直接使用且稳定。
零一万物 API 当前记录有免费试用:¥10;速率限制:5 RPM。
零一万物 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:¥10。适合直接替换 SDK base_url 做低成本测试。
注册智谱AI开放平台即送 100 万 token,可用于 GLM-4 系列模型,支持文本和图像生成,国内开发者直接使用,无需翻墙。
智谱清言 (智谱AI) API 当前记录有免费试用:500万 tokens;速率限制:5 RPM。
智谱AI 为新注册用户提供 100万 token 的免费 API 额度,可用于 GLM-4、GLM-4V 等模型,国内直连,支持 Python 和 HTTP 调用。
智谱 AI 为新注册用户提供 500 万免费 tokens,支持 GLM-4 系列模型,国内直接使用,无需翻墙,注册即送。
智谱清言 (智谱AI) 当前记录有免费额度:无明确限制。适合先试用再决定是否升级。
智谱AI为GLM-4系列模型提供注册即送18元免费API额度,支持对话、代码生成等,国内开发者可直接使用,无需海外工具。
智谱 AI 为新注册开发者提供 500 万 token 免费额度,可用于 GLM-4、GLM-4V 等最新模型,国内直接使用,支持手机号注册,无需海外支付方式。
智谱AI为新注册用户提供500万Token免费额度(含GLM-4、GLM-4V等多模态模型),额外赠送100元API体验金,可用于更高阶模型调用。国内手机号直接注册,无需海外支付方式。
智谱 GLM 是今天适合国内开发者优先领取的 API 羊毛:注册路径友好、国内直连、OpenAI 兼容,适合做中文客服、知识库、内容生成和多模态测试。额度和模型列表会随官方控制台调整,领取后建议先跑一个真实请求确认到账。
智谱AI 为新注册用户提供 100 万 token 的免费调用额度,同时赠送 100 元体验金,可用于 GLM-4、GLM-4V 等模型,支持国内直连,适合开发者和学生使用。
智谱 AI 为新用户提供 100 万 token 免费额度,可用于 GLM-4 系列模型(含 API 和 Web 端),国内直接注册使用,无需海外支付方式,适合中文场景开发。
智谱 AI 为开发者提供 GLM-4、GLM-3-Turbo 等模型的免费 API 调用额度,每月 100 万 Token,注册即享,支持国内网络直接使用,适合个人开发者和中小企业测试集成。
智谱 AI 为注册用户提供免费 100 万 token 额度,可用于 GLM-4、GLM-4-Flash 等模型 API 调用,国内开发者可直接使用,支持 Python SDK 和 OpenAI 兼容接口。
智谱清言 (智谱AI) 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:500万 tokens。适合直接替换 SDK base_url 做低成本测试。
智谱 AI 为新注册用户提供 500万 Token 免费额度,可用于 GLM-4、GLM-4V 等模型 API 调用,国内直接访问,支持微信/支付宝实名认证。
🎁 免费资料包
免费 API 清单、出海工具站案例、支付收款表、避坑指南和赚钱路径图,一次打包。