NVIDIA GB200 Superchip একাধিক GPU-তে কত ভাল স্কেল করে?

উত্তর

NVIDIA GB200 Superchip কর্মক্ষমতা শিরোনাম: 4,500 FP16 TFLOPS, 150 FP32 TFLOPS, 16,000 GB/s ব্যান্ডউইথ, 384 GB VRAM।

বাস্তব বেঞ্চমার্কে রূপান্তরিত: ৭ বিলিয়ন প্যারামিটার LLM মডেল FP16-এ যুক্তিসঙ্গত ব্যাচ সাইজে ট্রেনিং সাধারণত ব্যান্ডউইথের আগে কম্পিউট স্যাচুরেট করে; একই মডেলে রিয়েল-টাইম সার্ভিং সাধারণত ব্যান্ডউইথ-সীমাবদ্ধ এবং 16,000 GB/s সংখ্যাকে অনুসরণ করে। ডিফিউশন ইমেজ জেনারেশনের বেঞ্চমার্ক দুইটির মধ্যে থাকে — কম্পিউট-ভারী ধাপগুলি টেনসর কোর ভালোভাবে ব্যবহার করে, যখন অ্যাটেনশন ব্লকগুলো এখনও ব্যান্ডউইথে স্পর্শ করে।

See the NVIDIA GB200 Superchip page for the full spec sheet and comparisons to related GPUs.

NVIDIA GB200 Superchip সম্পর্কে আরও FAQ

NVIDIA GB200 Superchip অন্বেষণ করুন