Modal

无服务器 GPU 云，Python 代码直接部署，按秒计费

✅ 有免费额度

什么是 Modal

Modal 是一个无服务器 GPU 云平台，被称为"GPU 版的 Vercel"。它的核心理念是：你只需要写 Python 代码，加个装饰器就能在云端 GPU 上运行，不需要管 Docker、Kubernetes 或任何基础设施。

Modal 支持 A100、H100 等高端 GPU，按秒计费，空闲不收费。每月给 $30 免费额度，足够跑不少实验。冷启动速度业界最快，通常 1-2 秒。

免费额度与定价

免费额度：每月 $30（约 10 小时 A100 或 7.5 小时 H100）

热门 GPU 价格：
- T4: $0.59/hr
- A10G: $1.10/hr
- A100 40GB: $2.78/hr
- A100 80GB: $3.72/hr
- H100: $3.95/hr

按秒计费，空闲自动释放。比 RunPod 贵一些，但开发体验好很多。

编辑提示

编辑提示：如果只是 API 推理，通常不需要租 GPU；先比较官方免费额度、速率限制和延迟。

中国大陆使用指南

Modal 在中国大陆需要代理访问。注册和使用都需要稳定的国际网络。

如果你在中国大陆需要 GPU 算力，可以考虑 AutoDL 或 RunPod。如果只需要模型 API，直接用 API 聚合服务，中国大陆直连。

常见问题

Q: Modal 和 RunPod 怎么选？
A: Modal 开发体验更好（Python 原生），适合快速原型和无服务器场景。RunPod 更便宜，适合长时间跑任务。

Q: $30 免费额度够用吗？
A: 够跑不少实验。如果是持续的生产负载，需要付费。

Q: 支持哪些框架？
A: PyTorch、TensorFlow、vLLM、Hugging Face 等都支持，任何 Python 代码都能跑。