什么是 Banana

Banana（banana.dev）是一个无服务器 GPU 推理平台，专注于把 AI 模型部署为 API。你把模型打包成 Docker 容器，Banana 帮你管理 GPU 资源、自动扩缩容。

适合需要快速把模型上线为 API 的场景，比如 Stable Diffusion 图片生成、LLM 推理等。按请求计费，空闲不收费。

免费额度与定价

免费额度：新用户有体验额度，可以部署和测试模型。

定价模式：
- 按 GPU 秒计费
- A100 约 $1.25/hr
- 空闲不收费
- 自动扩缩容

价格比 Modal 便宜，但开发体验和文档不如 Modal 完善。

编辑提示

编辑提示：如果只是 API 推理，通常不需要租 GPU；先比较官方免费额度、速率限制和延迟。

中国大陆使用指南

Banana 在中国大陆需要代理访问。如果你在中国大陆需要部署模型，可以考虑 AutoDL 或 RunPod。

如果只需要调用模型 API，直接用 API 聚合服务，中国大陆直连无需代理。

常见问题

Q: Banana 和 Replicate 比怎么样？
A: Replicate 更成熟、模型市场更丰富。Banana 更灵活，适合自定义部署。

Q: 冷启动快吗？
A: 一般 5-15 秒，比 Modal 慢。可以设置最小实例数来避免冷启动。

Q: 支持哪些模型？
A: 任何能打包成 Docker 的模型都支持。常见的 LLM、Stable Diffusion、Whisper 等都可以。

Banana