NVIDIA H100 SXM 用于微调——速度够快吗？

答案

NVIDIA H100 SXM 的计算规格：990 FP16 TFLOPS，67 FP32 TFLOPS，内存带宽为 3,350 GB/s，配备 80 GB Hopper 封装。

实际上，这足以处理大批量 FP16 预训练，接近峰值利用率，并在典型批量服务模式下维持大型语言模型的生产推理。云端价格为 $1.57 每小时，性能价格比具有竞争力，尤其适合能够充分利用张量核心的团队。

Ready to deploy? Latitude.sh has NVIDIA H100 SXM from $1.57/hr. Vultr and Vast.ai also carry it.

Novita AI 对比 Latitude.sh 对比 Vultr 对比 Vast.ai 对比 Massed Compute 对比 DigitalOcean - GPU提供商比较（六月 2026）

Novita AI 对比 Latitude.sh 对比 Vultr 对比 Vast.ai 对比 Massed Compute 对比 DigitalOcean并排比较。快速查看最大资金、利润分成、风险规则、杠杆、平台、工具、支付计划、支付选项、交易权限和KYC限制，缩小你的专有交易公司候选名单。数据更新于六月 2026。

Novita AI 对比 Latitude.sh 对比 Vultr 对比 Vast.ai 对比 Massed Compute 对比 DigitalOcean - GPU提供商比较（六月 2026）
	Novita AI 拥有200多个模型API、GPU实例和大规模无服务器推理的AI与代理云平台。 Visit Novita AI	Latitude.sh 覆盖23个全球地点的裸金属GPU云 Visit Latitude.sh	Vultr 跨越32个全球区域的高性能云GPU Visit Vultr	Vast.ai 即时GPU。透明定价。 Visit Vast.ai	Massed Compute 具有直接工程师支持的GPU云 Visit Massed Compute	DigitalOcean 简单、可扩展的 AI/ML GPU 云 Visit DigitalOcean
概览
Trustpilot 评分	2.9	3.7	1.7	4.2	3.2	4.6
总部	United States	Brazil	United States	United States	United States	United States
供应商类型	以GPU为中心	裸金属	多云	GPU市场	专注于GPU	不适用
适用场景	AI 训练，推理，微调，生成式 AI，研究，大型语言模型服务，Stable Diffusion	AI 训练、推理、裸金属 GPU、微调、研究、专用工作负载、生成式 AI	人工智能训练、推理、视频渲染、高性能计算、稳定扩散、游戏开发、生成式人工智能、微调、研究	AI训练，推理，微调，Stable Diffusion，批处理，研究，大型语言模型服务，生成式AI	AI训练、推理、视觉特效渲染、生成式AI、微调、高性能计算、Stable Diffusion、研究	AI训练、推理、微调、大型语言模型部署、大型语言模型服务、计算机视觉、初创企业、生成式AI、研究
GPU硬件
GPU 型号	H100 SXM，A100 SXM，L40S，RTX 4090，RTX 6000 Ada，RTX 5090，RTX 3090	A30 RTX A5000 RTX A6000 L40S RTX 6000 Ada A100 SXM H100 SXM GH200 RTX PRO 6000	A16、A40、L40S、A100 PCIe、GH200、A100 SXM、H100 SXM、B200、B300、MI300X、MI325X、MI355X	B200，H200，H100 SXM，H100 NVL，A100 SXM，A100 PCIe，RTX 5090，RTX 5080，RTX 5070 Ti，RTX 6000 Pro，RTX 6000 Ada，RTX 4500 Ada，RTX A6000，RTX A5000，RTX A4000，L40S，L40，A40，A10，RTX 4090，RTX 4080，RTX 4070 Ti，RTX 4070，RTX 4060 Ti，RTX 4060，RTX 3090 Ti，RTX 3090，RTX 3080 Ti，RTX 3080，RTX 3070 Ti，RTX 3070，Tesla V100，Tesla T4，A2，GTX 1080	A30 RTX A5000 RTX A6000 L40S A100 SXM H100 PCIe H100 SXM H100 NVL RTX PRO 6000 H200 NVL	RTX 4000 Ada、RTX 6000 Ada、L40S、MI300X、H100 SXM、H200
最大显存 (GB)	80	96	288	192	141	192
每实例最大 GPU 数	8	8	16	8	8	8
互联	NVLink	NVLink	NVLink	NVLink，InfiniBand	NVLink	NVLink
定价
起始价格 ($/小时)	$0.11/hr	$0.35/hr	$0.47/hr	$0.06/hr	$0.35/hr	$0.76/hr
计费粒度	每秒	按小时计费	按小时计费	每秒	按分钟计费	按秒计费
竞价/可抢占	是	否	是	是	否	否
预留折扣	不适用	不适用	不适用	最高可达50%（1-6个月预订）	不适用	不适用
免费额度	初创企业最高可达 10,000 美元	通过推荐计划获得200美元	最高300美元免费额度，期限30天	注册时赠送少量测试积分	无	60 天内赠送 200 美元免费额度
出站费用	无（免费）	无	标准（根据计划不同而异）	根据主机不同而异（$/TB）	无	无（包含在套餐中）
存储	容器磁盘（60GB 免费），卷磁盘，网络卷	包含本地NVMe（最高4个3.8TB），块存储0.10美元/GB/月，文件系统存储0.05美元/GB/月	350 GB - 61 TB NVMe（包含），块存储每月0.10美元/GB，兼容S3的对象存储	根据主机不同而异（$/GB/小时，实例存在期间计费）	实例包含本地NVMe	500-720 GiB NVMe 启动盘（包含），大配置含 5 TiB NVMe 临时存储，卷存储费用为 0.10 美元/GiB/月
基础设施
区域	美国，欧洲，亚太，南美，非洲，中东（20+ 个地点）	23个地点：美国（8个城市）、拉美（5个）、欧洲（5个）、亚太（4个）、墨西哥城。GPU位于达拉斯、法兰克福、悉尼、东京	覆盖6大洲32个区域（美洲、欧洲、亚洲、澳大利亚、非洲）	500+地点，40+数据中心	美国（Tier III数据中心）	纽约（NYC2）、多伦多（TOR1）、亚特兰大（ATL1）、里士满（RIC1）、阿姆斯特丹（AMS3）
正常运行时间 SLA	99.9%	99.9%	100%	无正式SLA（可见主机可靠性评分）	Tier III（99.98%设计）	99%
开发者体验
框架	PyTorch，TensorFlow，CUDA，cuDNN，TensorRT	机器学习优化镜像，PyTorch，TensorFlow（用户安装），CUDA	PyTorch、TensorFlow、CUDA、cuDNN、ROCm、Hugging Face、NVIDIA NGC	PyTorch，TensorFlow，CUDA，vLLM，ComfyUI	PyTorch TensorFlow CUDA cuDNN ComfyUI 预配置的机器学习模板	PyTorch、TensorFlow、Jupyter、Miniconda、CUDA、ROCm、Hugging Face
Docker 支持	是	是	是	是	是	是
SSH 访问	是	是	是	是	是	是
Jupyter 笔记本	是	否	是	是	否	是
API / 命令行界面	是	是	是	是	是	是
设置时间	不适用	秒级	分钟	秒	分钟	分钟
Kubernetes 支持	否	否	是	否	否	是
业务条款
最小承诺	无	无	无	无	无	无
合规性	SOC 2	单租户隔离，支持DPA	SOC 2+（HIPAA）、PCI、ISO 27001、ISO 27017、ISO 27018、ISO 20000-1、CSA STAR 1级	SOC 2 类型2，HIPAA，GDPR，CCPA	SOC 2 类型II HIPAA	SOC 2 类型 II、SOC 3、HIPAA（含 BAA）、CSA STAR 1 级