NVIDIA L40S real-world generative AI performance

الإجابة

366 FP16 TFLOPS and 864 GB/s of memory bandwidth put NVIDIA L40S squarely in the class of accelerators targeted at modern transformer workloads. FP32 caps at 91.6 TFLOPS, which still handles most non-AI scientific compute comfortably.

For training from scratch, token throughput roughly tracks FP16 TFLOPS. For production inference on foundation models, throughput tracks bandwidth. Real-world numbers will depend heavily on the framework stack (PyTorch, TensorRT-LLM, vLLM), and can vary 30-50% depending on how aggressively you quantise.

The cheapest NVIDIA L40S right now is on Vast.ai at $0.55/hr; Novita AI and Latitude.sh also list it — pick the region and billing that fits your workload.

المزيد من الأسئلة الشائعة حول NVIDIA L40S

فاست.آي مقابل Novita AI مقابل Latitude.sh مقابل ران بود مقابل Massed Compute مقابل DigitalOcean - مقارنة مزودي GPU (أبريل 2026)

مقارنة جنبًا إلى جنب لـ فاست.آي مقابل Novita AI مقابل Latitude.sh مقابل ران بود مقابل Massed Compute مقابل DigitalOcean. استعرض بسرعة الحد الأقصى للتمويل، تقسيم الأرباح، قواعد المخاطر، الرافعة المالية، المنصات، الأدوات، جداول الدفع، خيارات الدفع، أذونات التداول وقيود التحقق من الهوية لتضييق قائمة شركات التداول الخاصة بك. تم تحديث البيانات أبريل 2026.

فاست.آي مقابل Novita AI مقابل Latitude.sh مقابل ران بود مقابل Massed Compute مقابل DigitalOcean - مقارنة مزودي GPU (أبريل 2026)
فاست.آي
وحدات معالجة الرسومات الفورية. تسعير شفاف.
Visit فاست.آي
Novita AI
منصة السحابة للذكاء الاصطناعي والوكيل مع أكثر من 200 واجهة برمجة تطبيقات للنماذج، وحالات GPU، واستدلال بدون خادم على نطاق واسع.
Visit Novita AI
Latitude.sh
سحابة GPU معدنية صافية عبر 23 موقعًا عالميًا
Visit Latitude.sh
ران بود
السحابة المبنية للذكاء الاصطناعي — نشر وتوسيع أحمال عمل GPU من الاستدلال بدون خادم إلى عناقيد متعددة العقد الفورية حسب الطلب.
Visit ران بود
Massed Compute
سحابة GPU مع دعم مباشر من المهندسين
Visit Massed Compute
DigitalOcean
سحابة GPU بسيطة وقابلة للتوسع للذكاء الاصطناعي وتعلم الآلة
Visit DigitalOcean
نظرة عامة
تقييم Trustpilot 4.4 3.3 3.7 3.7 0 4.6
المقر الرئيسي United States United States Brazil United States United States United States
نوع المزود سوق وحدات معالجة الرسومات موجهة نحو GPU معدني صافي موجهة نحو GPU موجهة نحو GPU غير متوفر
الأفضل لـ تدريب الذكاء الاصطناعي، الاستدلال، التخصيص الدقيق، Stable Diffusion، المعالجة الدُفعية، البحث، خدمة نماذج اللغة الكبيرة، الذكاء الاصطناعي التوليدي تدريب الذكاء الاصطناعي، الاستدلال، الضبط الدقيق، الذكاء الاصطناعي التوليدي، البحث، خدمة نماذج اللغة الكبيرة، Stable Diffusion تدريب الذكاء الاصطناعي، الاستدلال، GPU معدني خالص، التخصيص الدقيق، البحث، الأحمال المخصصة، الذكاء الاصطناعي التوليدي تدريب الذكاء الاصطناعي، الاستدلال، الضبط الدقيق، Stable Diffusion، المعالجة الدُفعية، العرض، البحث، تقديم نماذج اللغة الكبيرة، الذكاء الاصطناعي التوليدي تدريب الذكاء الاصطناعي، الاستدلال، عرض المؤثرات البصرية، الذكاء الاصطناعي التوليدي، التخصيص الدقيق، الحوسبة عالية الأداء، Stable Diffusion، البحث تدريب الذكاء الاصطناعي، الاستدلال، التخصيص الدقيق، نشر نماذج اللغة الكبيرة، تقديم نماذج اللغة الكبيرة، رؤية الحاسوب، الشركات الناشئة، الذكاء الاصطناعي التوليدي، البحث
عتاد GPU
نماذج وحدات معالجة الرسوميات B200، H200، H100 SXM، H100 NVL، A100 SXM، A100 PCIe، RTX 5090، RTX 5080، RTX 5070 Ti، RTX 6000 Pro، RTX 6000 Ada، RTX 4500 Ada، RTX A6000، RTX A5000، RTX A4000، L40S، L40، A40، A10، RTX 4090، RTX 4080، RTX 4070 Ti، RTX 4070، RTX 4060 Ti، RTX 4060، RTX 3090 Ti، RTX 3090، RTX 3080 Ti، RTX 3080، RTX 3070 Ti، RTX 3070، Tesla V100، Tesla T4، A2، GTX 1080 H100 SXM، A100 SXM، L40S، RTX 4090، RTX 6000 Ada، RTX 5090، RTX 3090 A30، RTX A5000، RTX A6000، L40S، RTX 6000 Ada، A100 SXM، H100 SXM، GH200، RTX PRO 6000 B300، B200، H200، H100 SXM، H100 PCIe، H100 NVL، MI300X، A100 SXM، A100 PCIe، RTX 5090، RTX PRO 6000، L40S، L40، RTX 6000 Ada، RTX 5000 Ada، RTX A6000، RTX A5000، RTX 4090، RTX 4080 SUPER، RTX 4080، RTX 4070 Ti، RTX 3090 Ti، RTX 3090، RTX 3080 Ti، RTX 3080، RTX 3070، A40، A30، A2، L4 A30، RTX A5000، RTX A6000، L40S، A100 SXM، H100 PCIe، H100 SXM، H100 NVL، RTX PRO 6000، H200 NVL RTX 4000 Ada، RTX 6000 Ada، L40S، MI300X، H100 SXM، H200
الحد الأقصى لذاكرة الفيديو (جيجابايت) 192 80 96 288 141 192
الحد الأقصى لوحدات معالجة الرسوميات/الحالة 8 8 8 8 8 8
الاتصال البيني NVLink، InfiniBand NVLink NVLink NVLink NVLink NVLink
التسعير
السعر الابتدائي (دولار/ساعة) $0.06/hr $0.11/hr $0.35/hr $0.06/hr $0.35/hr $0.76/hr
دقة الفوترة لكل ثانية في الثانية بالساعة لكل ثانية بالدقيقة بالثانية
نقاط/قابلة للإيقاف المؤقت نعم نعم لا نعم لا لا
خصومات محجوزة حتى 50٪ (محجوز من 1 إلى 6 أشهر) غير متوفر غير متوفر 15-29٪ (خطط من شهر إلى سنة) غير متوفر غير متوفر
أرصدة مجانية رصيد اختبار صغير عند التسجيل حتى 10,000 دولار للشركات الناشئة 200 دولار عبر برنامج الإحالة مكافأة من 5 إلى 500 دولار بعد أول إنفاق بقيمة 10 دولارات لا شيء رصيد مجاني بقيمة 200 دولار لمدة 60 يومًا
رسوم الإخراج يختلف حسب المضيف (دولار/تيرابايت) لا شيء (مجاني) لا شيء لا شيء (مجاني) لا شيء لا شيء (مشمول في الخطة)
التخزين يختلف حسب المضيف (دولار/جيجابايت/ساعة، يتم احتسابه أثناء وجود المثيل) قرص الحاوية (60 جيجابايت مجانية)، قرص الحجم، أحجام الشبكة NVMe محلي مشمول (حتى 4× 3.8 تيرابايت)، تخزين كتل 0.10 دولار/جيجابايت/شهر، تخزين نظام الملفات 0.05 دولار/جيجابايت/شهر الحاوية/الحجم (0.10 دولار/جيجابايت/شهر)، الحجم الخامل (0.20 دولار/جيجابايت/شهر)، تخزين الشبكة (0.07 دولار/جيجابايت/شهر 1TB) NVMe محلي مضمّن مع الحِجَر تمهيد NVMe بسعة 500-720 جيبي (مشمول)، مساحة تخزين NVMe مؤقتة بسعة 5 تيبي في التكوينات الأكبر، وحدات التخزين بسعر 0.10 دولار/جيبي/شهريًا
البنية التحتية
المناطق أكثر من 500 موقع، أكثر من 40 مركز بيانات الولايات المتحدة، الاتحاد الأوروبي، آسيا والمحيط الهادئ، أمريكا الجنوبية، أفريقيا، الشرق الأوسط (أكثر من 20 موقعًا) 23 موقعًا: الولايات المتحدة (8 مدن)، أمريكا اللاتينية (5)، أوروبا (5)، آسيا والمحيط الهادئ (4)، مدينة مكسيكو. GPU في دالاس، فرانكفورت، سيدني، طوكيو 31 منطقة عالمية الولايات المتحدة (مراكز بيانات من الدرجة الثالثة) نيويورك (NYC2)، تورونتو (TOR1)، أتلانتا (ATL1)، ريتشموند (RIC1)، أمستردام (AMS3)
اتفاقية مستوى الخدمة للجاهزية لا يوجد اتفاق مستوى خدمة رسمي (درجات موثوقية المضيف مرئية) 99.9% 99.9% 99.99٪ الدرجة الثالثة (تصميم 99.98%) 99%
تجربة المطور
الأُطُر PyTorch، TensorFlow، CUDA، vLLM، ComfyUI PyTorch، TensorFlow، CUDA، cuDNN، TensorRT صور محسنة للتعلم الآلي، PyTorch، TensorFlow (يتم تثبيته من قبل المستخدم)، CUDA PyTorch، TensorFlow، JAX، ONNX، CUDA PyTorch، TensorFlow، CUDA، cuDNN، ComfyUI، قوالب تعلم آلي مُعدة مسبقًا PyTorch، TensorFlow، Jupyter، Miniconda، CUDA، ROCm، Hugging Face
دعم دوكر نعم نعم نعم نعم نعم نعم
وصول SSH نعم نعم نعم نعم نعم نعم
دفاتر جوبيتر نعم نعم لا نعم لا نعم
واجهة برمجة التطبيقات / سطر الأوامر نعم نعم نعم نعم نعم نعم
وقت الإعداد ثوانٍ غير متوفر ثوانٍ فوري دقائق دقائق
دعم Kubernetes لا لا لا لا لا نعم
الشروط التجارية
الحد الأدنى للالتزام لا شيء لا شيء لا شيء لا شيء لا شيء لا شيء
الامتثال SOC 2 النوع 2، HIPAA، GDPR، CCPA SOC 2 عزل مستأجر منفرد، سياسة حماية البيانات متاحة SOC 2 النوع الثاني SOC 2 النوع الثاني، HIPAA SOC 2 النوع الثاني، SOC 3، HIPAA (مع اتفاقية BAA)، CSA STAR المستوى 1
فاست.آي Novita AI Latitude.sh ران بود Massed Compute DigitalOcean

استكشاف NVIDIA L40S