How well does NVIDIA GeForce RTX 5090 scale across multiple GPUs?
Odpověď
419 FP16 TFLOPS and 1,792 GB/s of memory bandwidth put NVIDIA GeForce RTX 5090 squarely in the class of accelerators targeted at modern transformer workloads. FP32 caps at 104.8 TFLOPS, which still handles most non-AI scientific compute comfortably.
For training from scratch, token throughput roughly tracks FP16 TFLOPS. For production inference on foundation models, throughput tracks bandwidth. Real-world numbers will depend heavily on the framework stack (PyTorch, TensorRT-LLM, vLLM), and can vary 30-50% depending on how aggressively you quantise.
Ready to deploy? Vast.ai has NVIDIA GeForce RTX 5090 from $0.34/hr. Novita AI and RunPod also carry it.
Více FAQ o NVIDIA GeForce RTX 5090
Vast.ai vs Novita AI vs RunPod – porovnání poskytovatelů GPU (Duben 2026)
Porovnání Vast.ai vs Novita AI vs RunPod vedle sebe. Rychle si prohlédněte maximální financování, rozdělení zisku, pravidla rizika, pákový efekt, platformy, nástroje, plány výplat, platební možnosti, obchodní oprávnění a omezení KYC, abyste zúžili seznam prop trading firem. Data aktualizována Duben 2026.
|
Vast.ai
Okamžité GPU. Transparentní ceny.
|
Novita AI
Platforma AI & Agent Cloud s více než 200 API modelů, GPU instancemi a serverless inferencí ve velkém měřítku.
|
RunPod
Cloud postavený pro AI — nasazujte a škálujte GPU úlohy od serverless inference až po okamžité multi-uzlové klastry na vyžádání.
|
|
|---|---|---|---|
| Přehled | |||
| Hodnocení Trustpilot | 4.4 | 3.3 | 3.7 |
| Sídlo | United States | United States | United States |
| Typ poskytovatele | Trh s GPU | Zaměřeno na GPU | Zaměřeno na GPU |
| Nejvhodnější pro | Trénink AI inference doladění Stable Diffusion dávkové zpracování výzkum poskytování LLM generativní AI | Trénink AI inference doladění generativní AI výzkum provoz LLM Stable Diffusion | Trénink AI inferenční výpočty doladění Stable Diffusion dávkové zpracování renderování výzkum poskytování LLM generativní AI |
| Hardware GPU | |||
| Modely GPU | B200 H200 H100 SXM H100 NVL A100 SXM A100 PCIe RTX 5090 RTX 5080 RTX 5070 Ti RTX 6000 Pro RTX 6000 Ada RTX 4500 Ada RTX A6000 RTX A5000 RTX A4000 L40S L40 A40 A10 RTX 4090 RTX 4080 RTX 4070 Ti RTX 4070 RTX 4060 Ti RTX 4060 RTX 3090 Ti RTX 3090 RTX 3080 Ti RTX 3080 RTX 3070 Ti RTX 3070 Tesla V100 Tesla T4 A2 GTX 1080 | H100 SXM A100 SXM L40S RTX 4090 RTX 6000 Ada RTX 5090 RTX 3090 | B300 B200 H200 H100 SXM H100 PCIe H100 NVL MI300X A100 SXM A100 PCIe RTX 5090 RTX PRO 6000 L40S L40 RTX 6000 Ada RTX 5000 Ada RTX A6000 RTX A5000 RTX 4090 RTX 4080 SUPER RTX 4080 RTX 4070 Ti RTX 3090 Ti RTX 3090 RTX 3080 Ti RTX 3080 RTX 3070 A40 A30 A2 L4 |
| Max. VRAM (GB) | 192 | 80 | 288 |
| Max. počet GPU na instanci | 8 | 8 | 8 |
| Propojovací rozhraní | NVLink, InfiniBand | NVLink | NVLink |
| Cenové podmínky | |||
| Počáteční cena ($/hod) | $0.06/hr | $0.11/hr | $0.06/hr |
| Granularita účtování | Za sekundu | Za sekundu | Za sekundu |
| Spot / přerušitelné | Ano | Ano | Ano |
| Rezervované slevy | Až 50 % (rezervace na 1–6 měsíců) | Není k dispozici | 15–29 % (plány od 1 měsíce do 1 roku) |
| Zdarma kredity | Malý testovací kredit při registraci | Až 10 000 $ pro startupy | Bonus 5–500 $ po prvním utracení 10 $ |
| Poplatky za odchozí data | Liší se podle hostitele (v $/TB) | Žádné (zdarma) | Žádný (zdarma) |
| Úložiště | Liší se podle hostitele (v $/GB/h, účtováno po dobu existence instance) | Disk kontejneru (60 GB zdarma), disk svazku, síťové svazky | Kontejner/objem (0,10 $/GB/měsíc), Nečinný objem (0,20 $/GB/měsíc), Síťové úložiště (0,07 $/GB/měsíc 1TB) |
| Infrastruktura | |||
| Regiony | Více než 500 lokalit, více než 40 datových center | USA, EU, APAC, Jižní Amerika, Afrika, Blízký východ (20+ lokalit) | 31 globálních regionů |
| SLA dostupnosti | Žádná formální SLA (viditelné skóre spolehlivosti hostitele) | 99,9 % | 99,99 % |
| Zkušenost vývojáře | |||
| Frameworky | PyTorch TensorFlow CUDA vLLM ComfyUI | PyTorch TensorFlow CUDA cuDNN TensorRT | PyTorch TensorFlow JAX ONNX CUDA |
| Podpora Dockeru | Ano | Ano | Ano |
| SSH přístup | Ano | Ano | Ano |
| Jupyter notebooky | Ano | Ano | Ano |
| API / CLI | Ano | Ano | Ano |
| Doba nastavení | Sekundy | Není k dispozici | Okamžitě |
| Podpora Kubernetes | Ne | Ne | Ne |
| Obchodní podmínky | |||
| Minimální závazek | Žádné | Žádné | Žádný |
| Soulad s předpisy | SOC 2 Typ 2 HIPAA GDPR CCPA | SOC 2 | SOC 2 Typ II |
Novita AI
RunPod