What discount can I expect on NVIDIA L40S with spot or reserved pricing?
คำตอบ
Expect NVIDIA L40S cloud price to begins at $0.55 per hour on-demand. According to our April 21, 2026 snapshot, the market's lowest-priced on-demand option is Vast.ai, while RunPod offers the lowest spot rate at $0.79 per hour — a up to 60% saving for interruption-tolerant jobs. Reserved contracts add another ~up to 40% discount for multi-month bookings.
Typical one-month on-demand bills run into four figures at full utilization, which is why production inference services usually migrate to reserved and experimental work stays on-demand or spot.
Top cloud providers offering NVIDIA L40S: Vast.ai (from $0.55/hr), Novita AI, and Latitude.sh. Start comparing live rates.
คำถามที่พบบ่อยเพิ่มเติมเกี่ยวกับ NVIDIA L40S
Vast.ai เทียบกับ Novita AI เทียบกับ Latitude.sh เทียบกับ RunPod เทียบกับ Massed Compute เทียบกับ DigitalOcean - การเปรียบเทียบผู้ให้บริการ GPU (เมษายน 2026)
การเปรียบเทียบข้างเคียงของ Vast.ai เทียบกับ Novita AI เทียบกับ Latitude.sh เทียบกับ RunPod เทียบกับ Massed Compute เทียบกับ DigitalOcean สแกนอย่างรวดเร็วเงินทุนสูงสุด, การแบ่งกำไร, กฎความเสี่ยง, เลเวอเรจ, แพลตฟอร์ม, เครื่องมือ, ตารางการจ่ายเงิน, ตัวเลือกการชำระเงิน, สิทธิ์การเทรด และข้อจำกัด KYC เพื่อจำกัดรายชื่อบริษัทเทรดของคุณ ข้อมูลอัปเดต เมษายน 2026
|
Vast.ai
การ์ดจอทันที ราคาชัดเจน
|
Novita AI
แพลตฟอร์ม AI & Agent Cloud พร้อม API โมเดลกว่า 200 รายการ อินสแตนซ์ GPU และการอนุมานแบบเซิร์ฟเวอร์เลสในระดับขนาดใหญ่
|
Latitude.sh
คลาวด์ GPU แบบ Bare metal ครอบคลุม 23 สถานที่ทั่วโลก
|
RunPod
คลาวด์ที่สร้างขึ้นสำหรับ AI — ปรับใช้และขยายงาน GPU ตั้งแต่การอนุมานแบบไม่มีเซิร์ฟเวอร์ไปจนถึงคลัสเตอร์หลายโหนดทันทีตามความต้องการ
|
Massed Compute
คลาวด์ GPU พร้อมการสนับสนุนโดยตรงจากวิศวกร
|
DigitalOcean
คลาวด์ GPU ที่เรียบง่ายและปรับขนาดได้สำหรับ AI/ML
|
|
|---|---|---|---|---|---|---|
| ภาพรวม | ||||||
| คะแนน Trustpilot | 4.4 | 3.3 | 3.7 | 3.7 | 0 | 4.6 |
| สำนักงานใหญ่ | United States | United States | Brazil | United States | United States | United States |
| ประเภทผู้ให้บริการ | ตลาดการ์ดจอ | มุ่งเน้น GPU | Bare Metal | มุ่งเน้น GPU | เน้น GPU | ไม่มีข้อมูล |
| เหมาะสำหรับ | การฝึกอบรม AI การอนุมาน การปรับแต่ง Stable Diffusion การประมวลผลแบบกลุ่ม การวิจัย การให้บริการ LLM AI สร้างสรรค์ | การฝึกอบรม AI การอนุมาน การปรับแต่ง AI สร้างสรรค์ การวิจัย การให้บริการ LLM Stable Diffusion | การฝึกอบรม AI การอนุมาน GPU แบบ Bare Metal การปรับแต่งละเอียด การวิจัย งานเฉพาะทาง AI สร้างสรรค์ | การฝึกอบรม AI การอนุมาน การปรับแต่ง Stable Diffusion การประมวลผลเป็นชุด การเรนเดอร์ การวิจัย การให้บริการ LLM ปัญญาประดิษฐ์เชิงสร้างสรรค์ | การฝึกอบรม AI การอนุมาน การเรนเดอร์ VFX AI สร้างสรรค์ การปรับแต่งละเอียด HPC Stable Diffusion การวิจัย | การฝึกอบรม AI การอนุมาน การปรับแต่ง การปรับใช้ LLM การให้บริการ LLM การมองเห็นด้วยคอมพิวเตอร์ สตาร์ทอัพ AI สร้างสรรค์ การวิจัย |
| ฮาร์ดแวร์ GPU | ||||||
| รุ่น GPU | B200 H200 H100 SXM H100 NVL A100 SXM A100 PCIe RTX 5090 RTX 5080 RTX 5070 Ti RTX 6000 Pro RTX 6000 Ada RTX 4500 Ada RTX A6000 RTX A5000 RTX A4000 L40S L40 A40 A10 RTX 4090 RTX 4080 RTX 4070 Ti RTX 4070 RTX 4060 Ti RTX 4060 RTX 3090 Ti RTX 3090 RTX 3080 Ti RTX 3080 RTX 3070 Ti RTX 3070 Tesla V100 Tesla T4 A2 GTX 1080 | H100 SXM A100 SXM L40S RTX 4090 RTX 6000 Ada RTX 5090 RTX 3090 | A30 RTX A5000 RTX A6000 L40S RTX 6000 Ada A100 SXM H100 SXM GH200 RTX PRO 6000 | B300 B200 H200 H100 SXM H100 PCIe H100 NVL MI300X A100 SXM A100 PCIe RTX 5090 RTX PRO 6000 L40S L40 RTX 6000 Ada RTX 5000 Ada RTX A6000 RTX A5000 RTX 4090 RTX 4080 SUPER RTX 4080 RTX 4070 Ti RTX 3090 Ti RTX 3090 RTX 3080 Ti RTX 3080 RTX 3070 A40 A30 A2 L4 | A30 RTX A5000 RTX A6000 L40S A100 SXM H100 PCIe H100 SXM H100 NVL RTX PRO 6000 H200 NVL | RTX 4000 Ada RTX 6000 Ada L40S MI300X H100 SXM H200 |
| VRAM สูงสุด (GB) | 192 | 80 | 96 | 288 | 141 | 192 |
| จำนวน GPU สูงสุดต่ออินสแตนซ์ | 8 | 8 | 8 | 8 | 8 | 8 |
| การเชื่อมต่อระหว่างกัน | NVLink, InfiniBand | NVLink | NVLink | NVLink | NVLink | NVLink |
| ราคา | ||||||
| ราคาเริ่มต้น ($/ชม) | $0.06/hr | $0.11/hr | $0.35/hr | $0.06/hr | $0.35/hr | $0.76/hr |
| ความละเอียดการเรียกเก็บเงิน | ต่อวินาที | ต่อวินาที | ต่อชั่วโมง | ต่อวินาที | รายนาที | ต่อวินาที |
| Spot/Preemptible | ใช่ | ใช่ | ไม่ | ใช่ | ไม่ | ไม่ |
| ส่วนลดสำหรับการจองล่วงหน้า | สูงสุด 50% (จองล่วงหน้า 1-6 เดือน) | ไม่มีข้อมูล | ไม่มีข้อมูล | 15-29% (แผน 1 เดือนถึง 1 ปี) | ไม่มีข้อมูล | ไม่มีข้อมูล |
| เครดิตฟรี | เครดิตทดสอบเล็กน้อยเมื่อสมัคร | สูงสุด $10,000 สำหรับสตาร์ทอัพ | $200 ผ่านโปรแกรมแนะนำ | โบนัส $5-$500 หลังใช้จ่ายครั้งแรก $10 | ไม่มี | เครดิตฟรี 200 ดอลลาร์ ใช้งานได้ 60 วัน |
| ค่าธรรมเนียมการส่งข้อมูลออก | แตกต่างตามโฮสต์ (ดอลลาร์/เทราไบต์) | ไม่มี (ฟรี) | ไม่มี | ไม่มี (ฟรี) | ไม่มี | ไม่มี (รวมอยู่ในแผน) |
| ที่เก็บข้อมูล | แตกต่างตามโฮสต์ (ดอลลาร์/กิกะไบต์/ชั่วโมง, คิดค่าบริการขณะที่อินสแตนซ์ยังอยู่) | ดิสก์คอนเทนเนอร์ (60GB ฟรี), ดิสก์โวลุ่ม, โวลุ่มเครือข่าย | รวม NVMe ในเครื่อง (สูงสุด 4x 3.8TB), Block Storage $0.10/GB/เดือน, Filesystem Storage $0.05/GB/เดือน | คอนเทนเนอร์/โวลุ่ม ($0.10/GB/เดือน), โวลุ่มว่างงาน ($0.20/GB/เดือน), ที่เก็บข้อมูลเครือข่าย ($0.07/GB/เดือน 1TB) | รวม NVMe ในเครื่องท้องถิ่นกับอินสแตนซ์ | บูต NVMe ขนาด 500-720 GiB (รวมอยู่แล้ว), พื้นที่ scratch NVMe ขนาด 5 TiB สำหรับการตั้งค่าขนาดใหญ่, โวลุ่มราคา 0.10 ดอลลาร์/GiB/เดือน |
| โครงสร้างพื้นฐาน | ||||||
| ภูมิภาค | มากกว่า 500 แห่ง, ศูนย์ข้อมูลมากกว่า 40 แห่ง | สหรัฐอเมริกา, ยุโรป, เอเชียแปซิฟิก, อเมริกาใต้, แอฟริกา, ตะวันออกกลาง (กว่า 20 แห่ง) | 23 สถานที่: สหรัฐอเมริกา (8 เมือง), ละตินอเมริกา (5), ยุโรป (5), เอเชียแปซิฟิก (4), เม็กซิโกซิตี้ GPU มีในดัลลัส, แฟรงก์เฟิร์ต, ซิดนีย์, โตเกียว | 31 ภูมิภาคทั่วโลก | สหรัฐอเมริกา (ศูนย์ข้อมูล Tier III) | นิวยอร์ก (NYC2), โตรอนโต (TOR1), แอตแลนตา (ATL1), ริชมอนด์ (RIC1), อัมสเตอร์ดัม (AMS3) |
| SLA ความพร้อมใช้งาน | ไม่มี SLA อย่างเป็นทางการ (คะแนนความน่าเชื่อถือของโฮสต์แสดงให้เห็น) | 99.9% | 99.9% | 99.99% | Tier III (ออกแบบ 99.98%) | 99% |
| ประสบการณ์นักพัฒนา | ||||||
| เฟรมเวิร์ก | PyTorch TensorFlow CUDA vLLM ComfyUI | PyTorch TensorFlow CUDA cuDNN TensorRT | อิมเมจที่ปรับแต่งสำหรับ ML PyTorch TensorFlow (ติดตั้งโดยผู้ใช้) CUDA | PyTorch TensorFlow JAX ONNX CUDA | PyTorch TensorFlow CUDA cuDNN ComfyUI เทมเพลต ML ที่ตั้งค่าล่วงหน้า | PyTorch TensorFlow Jupyter Miniconda CUDA ROCm Hugging Face |
| รองรับ Docker | ใช่ | ใช่ | ใช่ | ใช่ | ใช่ | ใช่ |
| การเข้าถึง SSH | ใช่ | ใช่ | ใช่ | ใช่ | ใช่ | ใช่ |
| Jupyter Notebooks | ใช่ | ใช่ | ไม่ | ใช่ | ไม่ | ใช่ |
| API / CLI | ใช่ | ใช่ | ใช่ | ใช่ | ใช่ | ใช่ |
| เวลาติดตั้ง | วินาที | ไม่มีข้อมูล | วินาที | ทันที | นาที | นาที |
| รองรับ Kubernetes | ไม่ | ไม่ | ไม่ | ไม่ | ไม่ | ใช่ |
| ข้อกำหนดทางธุรกิจ | ||||||
| ข้อตกลงขั้นต่ำ | ไม่มี | ไม่มี | ไม่มี | ไม่มี | ไม่มี | ไม่มี |
| การปฏิบัติตามข้อกำหนด | SOC 2 ประเภท 2 HIPAA GDPR CCPA | SOC 2 | การแยกผู้เช่าแบบเดี่ยว มี DPA ให้บริการ | SOC 2 ประเภท II | SOC 2 Type II HIPAA | SOC 2 Type II SOC 3 HIPAA (พร้อม BAA) CSA STAR ระดับ 1 |
Novita AI
Latitude.sh
RunPod
DigitalOcean