Modal
无服务器 GPU 云,Python 代码直接部署,按秒计费
什么是 Modal
Modal 是一个无服务器 GPU 云平台,被称为"GPU 版的 Vercel"。它的核心理念是:你只需要写 Python 代码,加个装饰器就能在云端 GPU 上运行,不需要管 Docker、Kubernetes 或任何基础设施。
Modal 支持 A100、H100 等高端 GPU,按秒计费,空闲不收费。每月给 $30 免费额度,足够跑不少实验。冷启动速度业界最快,通常 1-2 秒。
Modal 支持 A100、H100 等高端 GPU,按秒计费,空闲不收费。每月给 $30 免费额度,足够跑不少实验。冷启动速度业界最快,通常 1-2 秒。
免费额度与定价
免费额度:每月 $30(约 10 小时 A100 或 7.5 小时 H100)
热门 GPU 价格:
- T4: $0.59/hr
- A10G: $1.10/hr
- A100 40GB: $2.78/hr
- A100 80GB: $3.72/hr
- H100: $3.95/hr
按秒计费,空闲自动释放。比 RunPod 贵一些,但开发体验好很多。
热门 GPU 价格:
- T4: $0.59/hr
- A10G: $1.10/hr
- A100 40GB: $2.78/hr
- A100 80GB: $3.72/hr
- H100: $3.95/hr
按秒计费,空闲自动释放。比 RunPod 贵一些,但开发体验好很多。
编辑提示
编辑提示:如果只是 API 推理,通常不需要租 GPU;先比较官方免费额度、速率限制和延迟。
国内使用指南
Modal 在国内需要代理访问。注册和使用都需要稳定的国际网络。
如果你在国内需要 GPU 算力,可以考虑 AutoDL 或 RunPod。如果只需要模型 API,直接用 API 聚合服务,国内直连。
如果你在国内需要 GPU 算力,可以考虑 AutoDL 或 RunPod。如果只需要模型 API,直接用 API 聚合服务,国内直连。
常见问题
Q: Modal 和 RunPod 怎么选?
A: Modal 开发体验更好(Python 原生),适合快速原型和无服务器场景。RunPod 更便宜,适合长时间跑任务。
Q: $30 免费额度够用吗?
A: 够跑不少实验。如果是持续的生产负载,需要付费。
Q: 支持哪些框架?
A: PyTorch、TensorFlow、vLLM、Hugging Face 等都支持,任何 Python 代码都能跑。
A: Modal 开发体验更好(Python 原生),适合快速原型和无服务器场景。RunPod 更便宜,适合长时间跑任务。
Q: $30 免费额度够用吗?
A: 够跑不少实验。如果是持续的生产负载,需要付费。
Q: 支持哪些框架?
A: PyTorch、TensorFlow、vLLM、Hugging Face 等都支持,任何 Python 代码都能跑。