NVIDIA L40S real-world generative AI performance

উত্তর

366 FP16 TFLOPS and 864 GB/s of memory bandwidth put NVIDIA L40S squarely in the class of accelerators targeted at modern transformer workloads. FP32 caps at 91.6 TFLOPS, which still handles most non-AI scientific compute comfortably.

For training from scratch, token throughput roughly tracks FP16 TFLOPS. For production inference on foundation models, throughput tracks bandwidth. Real-world numbers will depend heavily on the framework stack (PyTorch, TensorRT-LLM, vLLM), and can vary 30-50% depending on how aggressively you quantise.

The cheapest NVIDIA L40S right now is on Vast.ai at $0.55/hr; Novita AI and Latitude.sh also list it — pick the region and billing that fits your workload.

NVIDIA L40S সম্পর্কে আরও FAQ

ভাস্ট.এআই বনাম নভিতা AI বনাম ল্যাটিটিউড.শ বনাম রানপড বনাম ম্যাসড কম্পিউট বনাম ডিজিটালওশান - GPU প্রদানকারী তুলনা (এপ্রিল 2026)

ভাস্ট.এআই বনাম নভিতা AI বনাম ল্যাটিটিউড.শ বনাম রানপড বনাম ম্যাসড কম্পিউট বনাম ডিজিটালওশান এর পাশাপাশি তুলনা। দ্রুত সর্বোচ্চ তহবিল, লাভের ভাগ, ঝুঁকি নিয়ম, লিভারেজ, প্ল্যাটফর্ম, যন্ত্রপাতি, পেমেন্ট সূচি, পেমেন্ট অপশন, ট্রেডিং অনুমতি ও KYC সীমাবদ্ধতা দেখে আপনার প্রপ ট্রেডিং ফার্মের শর্টলিস্ট সংকুচিত করুন। তথ্য আপডেট করা হয়েছে এপ্রিল 2026 তারিখে।

ভাস্ট.এআই বনাম নভিতা AI বনাম ল্যাটিটিউড.শ বনাম রানপড বনাম ম্যাসড কম্পিউট বনাম ডিজিটালওশান - GPU প্রদানকারী তুলনা (এপ্রিল 2026)
ভাস্ট.এআই
তাৎক্ষণিক GPU। স্বচ্ছ মূল্য নির্ধারণ।
Visit ভাস্ট.এআই
নভিতা AI
২০০+ মডেল API, GPU ইনস্ট্যান্স, এবং স্কেলে সার্ভারলেস ইনফারেন্স সহ AI ও এজেন্ট ক্লাউড প্ল্যাটফর্ম।
Visit নভিতা AI
ল্যাটিটিউড.শ
২৩টি বিশ্বব্যাপী অবস্থানে বেয়ার মেটাল GPU ক্লাউড
Visit ল্যাটিটিউড.শ
রানপড
AI-এর জন্য তৈরি ক্লাউড — সার্ভারলেস ইনফারেন্স থেকে চাহিদা অনুযায়ী তাৎক্ষণিক মাল্টি-নোড ক্লাস্টারে GPU ওয়ার্কলোড মোতায়েন এবং স্কেল করুন।
Visit রানপড
ম্যাসড কম্পিউট
সরাসরি ইঞ্জিনিয়ার সমর্থনসহ GPU ক্লাউড
Visit ম্যাসড কম্পিউট
ডিজিটালওশান
সহজ, স্কেলেবল GPU ক্লাউড AI/ML এর জন্য
Visit ডিজিটালওশান
ওভারভিউ
ট্রাস্টপাইলট রেটিং 4.4 3.3 3.7 3.7 0 4.6
সদর দফতর United States United States Brazil United States United States United States
প্রদানকারী প্রকার GPU মার্কেটপ্লেস GPU-কেন্দ্রিক বেয়ার মেটাল GPU-কেন্দ্রিক GPU-কেন্দ্রিক প্রযোজ্য নয়
সেরা জন্য AI প্রশিক্ষণ ইনফারেন্স ফাইন-টিউনিং স্টেবল ডিফিউশন ব্যাচ প্রসেসিং গবেষণা LLM সার্ভিং জেনারেটিভ AI এআই প্রশিক্ষণ ইনফারেন্স ফাইন-টিউনিং জেনারেটিভ এআই গবেষণা এলএলএম সার্ভিং স্টেবল ডিফিউশন এআই প্রশিক্ষণ ইনফারেন্স বেয়ার মেটাল জিপিইউ ফাইন-টিউনিং গবেষণা নিবেদিত ওয়ার্কলোড জেনারেটিভ এআই এআই প্রশিক্ষণ ইনফারেন্স ফাইন-টিউনিং স্টেবল ডিফিউশন ব্যাচ প্রসেসিং রেন্ডারিং গবেষণা এলএলএম সার্ভিং জেনারেটিভ এআই AI প্রশিক্ষণ ইনফারেন্স VFX রেন্ডারিং জেনারেটিভ AI ফাইন-টিউনিং HPC স্টেবল ডিফিউশন গবেষণা এআই প্রশিক্ষণ অনুমান ফাইন-টিউনিং এলএলএম মোতায়েন এলএলএম সার্ভিং কম্পিউটার ভিশন স্টার্টআপ জেনারেটিভ এআই গবেষণা
GPU হার্ডওয়্যার
GPU মডেল B200 H200 H100 SXM H100 NVL A100 SXM A100 PCIe RTX 5090 RTX 5080 RTX 5070 Ti RTX 6000 Pro RTX 6000 Ada RTX 4500 Ada RTX A6000 RTX A5000 RTX A4000 L40S L40 A40 A10 RTX 4090 RTX 4080 RTX 4070 Ti RTX 4070 RTX 4060 Ti RTX 4060 RTX 3090 Ti RTX 3090 RTX 3080 Ti RTX 3080 RTX 3070 Ti RTX 3070 Tesla V100 Tesla T4 A2 GTX 1080 H100 SXM A100 SXM L40S RTX 4090 RTX 6000 Ada RTX 5090 RTX 3090 A30 RTX A5000 RTX A6000 L40S RTX 6000 Ada A100 SXM H100 SXM GH200 RTX PRO 6000 B300 B200 H200 H100 SXM H100 PCIe H100 NVL MI300X A100 SXM A100 PCIe RTX 5090 RTX PRO 6000 L40S L40 RTX 6000 Ada RTX 5000 Ada RTX A6000 RTX A5000 RTX 4090 RTX 4080 SUPER RTX 4080 RTX 4070 Ti RTX 3090 Ti RTX 3090 RTX 3080 Ti RTX 3080 RTX 3070 A40 A30 A2 L4 A30 RTX A5000 RTX A6000 L40S A100 SXM H100 PCIe H100 SXM H100 NVL RTX PRO 6000 H200 NVL RTX 4000 Ada RTX 6000 Ada L40S MI300X H100 SXM H200
সর্বোচ্চ VRAM (GB) 192 80 96 288 141 192
সর্বোচ্চ GPU/ইনস্ট্যান্স 8 8 8 8 8 8
ইন্টারকানেক্ট NVLink, ইনফিনিব্যান্ড এনভিলিঙ্ক NVLink এনভিলিঙ্ক NVLink NVLink
মূল্য নির্ধারণ
শুরু মূল্য ($/ঘন্টা) $0.06/hr $0.11/hr $0.35/hr $0.06/hr $0.35/hr $0.76/hr
বিলিং সূক্ষ্মতা প্রতি সেকেন্ডে প্রতি সেকেন্ডে প্রতি ঘণ্টা প্রতি সেকেন্ডে প্রতি মিনিট প্রতি সেকেন্ডে
স্পট/প্রিম্পটিবল না না না না না না
সংরক্ষিত ছাড় সর্বোচ্চ ৫০% (১-৬ মাস সংরক্ষিত) প্রযোজ্য নয় প্রযোজ্য নয় ১৫-২৯% (১ মাস থেকে ১ বছরের পরিকল্পনা) প্রযোজ্য নয় প্রযোজ্য নয়
ফ্রি ক্রেডিট সাইনআপে ছোট টেস্ট ক্রেডিট স্টার্টআপের জন্য সর্বোচ্চ $১০,০০০ রেফারেল প্রোগ্রামের মাধ্যমে $২০০ প্রথম $১০ খরচের পর $৫-$৫০০ বোনাস নেই ৬০ দিনের জন্য $২০০ ফ্রি ক্রেডিট
ইগ্রেস ফি হোস্ট অনুযায়ী পরিবর্তিত ($/টিবি) নেই (বিনামূল্যে) নেই নেই (বিনামূল্যে) নেই নেই (পরিকল্পনায় অন্তর্ভুক্ত)
স্টোরেজ হোস্ট অনুযায়ী পরিবর্তিত ($/জিবি/ঘন্টা, ইনস্ট্যান্স থাকা অবস্থায় চার্জ করা হয়) কন্টেইনার ডিস্ক (৬০জিবি ফ্রি), ভলিউম ডিস্ক, নেটওয়ার্ক ভলিউম স্থানীয় NVMe অন্তর্ভুক্ত (সর্বোচ্চ ৪x ৩.৮TB), ব্লক স্টোরেজ $০.১০/GB/মাস, ফাইলসিস্টেম স্টোরেজ $০.০৫/GB/মাস কনটেইনার/ভলিউম ($০.১০/জিবি/মাস), আইডল ভলিউম ($০.২০/জিবি/মাস), নেটওয়ার্ক স্টোরেজ ($০.০৭/জিবি/মাস ১টিবি) ইনস্ট্যান্সের সাথে স্থানীয় NVMe অন্তর্ভুক্ত ৫০০-৭২০ GiB NVMe বুট (অন্তর্ভুক্ত), বড় কনফিগারেশনে ৫ TiB NVMe স্ক্র্যাচ, ভলিউম $০.১০/GiB/মাস
ইনফ্রাস্ট্রাকচার
অঞ্চল ৫০০+ লোকেশন, ৪০+ ডেটা সেন্টার যুক্তরাষ্ট্র, ইউরোপীয় ইউনিয়ন, এপ্যাক, দক্ষিণ আমেরিকা, আফ্রিকা, মধ্যপ্রাচ্য (২০+ স্থান) ২৩টি অবস্থান: যুক্তরাষ্ট্র (৮টি শহর), ল্যাটিন আমেরিকা (৫), ইউরোপ (৫), এপ্যাক (৪), মেক্সিকো সিটি। GPU ডালাস, ফ্রাঙ্কফুর্ট, সিডনি, টোকিওতে ৩১টি বিশ্বব্যাপী অঞ্চল মার্কিন যুক্তরাষ্ট্র (Tier III ডেটা সেন্টার) নিউ ইয়র্ক (NYC2), টরন্টো (TOR1), আটলান্টা (ATL1), রিচমন্ড (RIC1), আমস্টারডাম (AMS3)
আপটাইম SLA কোনো আনুষ্ঠানিক SLA নেই (হোস্ট নির্ভরযোগ্যতা স্কোর দৃশ্যমান) ৯৯.৯% ৯৯.৯% ৯৯.৯৯% Tier III (৯৯.৯৮% ডিজাইন) ৯৯%
ডেভেলপার অভিজ্ঞতা
ফ্রেমওয়ার্ক PyTorch TensorFlow CUDA vLLM ComfyUI পাইটর্চ টেনসরফ্লো কুডা কুডিএনএন টেনসরআরটি ML-অপ্টিমাইজড ইমেজ PyTorch TensorFlow (ব্যবহারকারী ইনস্টল করা) CUDA পাইটর্চ টেনসরফ্লো জ্যাক্স ওএনএনএক্স কুডা PyTorch TensorFlow CUDA cuDNN ComfyUI পূর্ব-সংরচিত ML টেমপ্লেট PyTorch TensorFlow Jupyter Miniconda CUDA ROCm Hugging Face
ডকার সমর্থন না না না না না না
SSH অ্যাক্সেস না না না না না না
জুপিটার নোটবুক না না না না না না
API / CLI না না না না না না
সেটআপ সময় সেকেন্ড প্রযোজ্য নয় সেকেন্ড তাৎক্ষণিক মিনিট মিনিট
Kubernetes সাপোর্ট না না না না না না
ব্যবসায়িক শর্তাবলী
ন্যূনতম প্রতিশ্রুতি নেই নেই নেই নেই নেই নেই
সম্মতি SOC 2 টাইপ ২ HIPAA GDPR CCPA এসওসি ২ একক-ভাড়াটিয়া বিচ্ছিন্নতা DPA উপলব্ধ এসওসি ২ টাইপ II SOC 2 টাইপ II HIPAA SOC 2 টাইপ II SOC 3 HIPAA (BAA সহ) CSA STAR লেভেল ১
ভাস্ট.এআই নভিতা AI ল্যাটিটিউড.শ রানপড ম্যাসড কম্পিউট ডিজিটালওশান

NVIDIA L40S অন্বেষণ করুন