RunPod 是否提供用于推理的无服务器 GPU?

答案

无服务器GPU在 RunPod: 1

无服务器GPU推理允许您部署模型,当请求到达时自动扩展,空闲时自动缩减至零,消除了在空闲期间保持GPU运行的成本。这对于流量模式变化或不可预测的应用尤其具有成本效益。

RunPod 标准GPU定价起始于 $0.06/hr,采用 每秒 计费。

有关无服务器GPU端点设置指南和定价,请参见 RunPod 官方网站

更多关于 RunPod 的常见问题

包含 RunPod 的指南

这些指南将 RunPod 与其他云GPU提供商一起列出,按GPU特性、框架、可用性和开发者需求分组。

RunPod 对比 Massed Compute 对比 DigitalOcean - GPU Provider Comparison (四月 2026)

Side-by-side comparison of RunPod 对比 Massed Compute 对比 DigitalOcean. Quickly scan maximum funding, profit splits, risk rules, leverage, platforms, instruments, payout schedules, payment options, trading permissions and KYC restrictions to narrow down your prop trading firm shortlist. Data updated 四月 2026.

RunPod 对比 Massed Compute 对比 DigitalOcean - GPU Provider Comparison (四月 2026)
RunPod
为人工智能打造的云平台 — 从无服务器推理到按需即时多节点集群,部署和扩展GPU工作负载。
Visit RunPod
Massed Compute
具有直接工程师支持的GPU云
Visit Massed Compute
DigitalOcean
简单、可扩展的 AI/ML GPU 云
Visit DigitalOcean
概览
Trustpilot 评分 3.8 0 4.6
总部 United States United States United States
供应商类型 以GPU为中心 专注于GPU 不适用
适用场景 AI训练、推理、微调、Stable Diffusion、批处理、渲染、研究、大型语言模型服务、生成式AI AI训练、推理、视觉特效渲染、生成式AI、微调、高性能计算、Stable Diffusion、研究 AI训练、推理、微调、大型语言模型部署、大型语言模型服务、计算机视觉、初创企业、生成式AI、研究
GPU Hardware
GPU 型号 B300 B200 H200 H100 SXM H100 PCIe H100 NVL MI300X A100 SXM A100 PCIe RTX 5090 RTX PRO 6000 L40S L40 RTX 6000 Ada RTX 5000 Ada RTX A6000 RTX A5000 RTX 4090 RTX 4080 SUPER RTX 4080 RTX 4070 Ti RTX 3090 Ti RTX 3090 RTX 3080 Ti RTX 3080 RTX 3070 A40 A30 A2 L4 A30 RTX A5000 RTX A6000 L40S A100 SXM H100 PCIe H100 SXM H100 NVL RTX PRO 6000 H200 NVL RTX 4000 Ada、RTX 6000 Ada、L40S、MI300X、H100 SXM、H200
最大显存 (GB) 288 141 192
每实例最大 GPU 数 8 8 8
互联 NVLink NVLink NVLink
Pricing
起始价格 ($/小时) $0.06/hr $0.35/hr $0.76/hr
计费粒度 每秒 按分钟计费 按秒计费
竞价/可抢占 1 0 0
预留折扣 15-29%(1个月至1年计划) 不适用 不适用
免费额度 首次消费满10美元后奖励5-500美元 60 天内赠送 200 美元免费额度
出站费用 无(免费) 无(包含在套餐中)
存储 容器/卷(每GB每月0.10美元),空闲卷(每GB每月0.20美元),网络存储(每GB每月0.07美元 1TB) 实例包含本地NVMe 500-720 GiB NVMe 启动盘(包含),大配置含 5 TiB NVMe 临时存储,卷存储费用为 0.10 美元/GiB/月
Infrastructure
区域 31个全球区域 美国(Tier III数据中心) 纽约(NYC2)、多伦多(TOR1)、亚特兰大(ATL1)、里士满(RIC1)、阿姆斯特丹(AMS3)
正常运行时间 SLA 99.99% Tier III(99.98%设计) 99%
Developer Experience
框架 PyTorch TensorFlow JAX ONNX CUDA PyTorch TensorFlow CUDA cuDNN ComfyUI 预配置的机器学习模板 PyTorch、TensorFlow、Jupyter、Miniconda、CUDA、ROCm、Hugging Face
Docker 支持 1 1 1
SSH 访问 1 1 1
Jupyter 笔记本 1 0 1
API / 命令行界面 1 1 1
设置时间 即时 分钟 分钟
Kubernetes Support 0 0 1
Business Terms
最小承诺
合规性 SOC 2 类型 II SOC 2 类型II HIPAA SOC 2 类型 II、SOC 3、HIPAA(含 BAA)、CSA STAR 1 级
RunPod Massed Compute DigitalOcean