NVIDIA GB200 Superchip একাধিক GPU-তে কত ভাল স্কেল করে?
উত্তর
NVIDIA GB200 Superchip কর্মক্ষমতা শিরোনাম: 4,500 FP16 TFLOPS, 150 FP32 TFLOPS, 16,000 GB/s ব্যান্ডউইথ, 384 GB VRAM।
বাস্তব বেঞ্চমার্কে রূপান্তরিত: ৭ বিলিয়ন প্যারামিটার LLM মডেল FP16-এ যুক্তিসঙ্গত ব্যাচ সাইজে ট্রেনিং সাধারণত ব্যান্ডউইথের আগে কম্পিউট স্যাচুরেট করে; একই মডেলে রিয়েল-টাইম সার্ভিং সাধারণত ব্যান্ডউইথ-সীমাবদ্ধ এবং 16,000 GB/s সংখ্যাকে অনুসরণ করে। ডিফিউশন ইমেজ জেনারেশনের বেঞ্চমার্ক দুইটির মধ্যে থাকে — কম্পিউট-ভারী ধাপগুলি টেনসর কোর ভালোভাবে ব্যবহার করে, যখন অ্যাটেনশন ব্লকগুলো এখনও ব্যান্ডউইথে স্পর্শ করে।
See the NVIDIA GB200 Superchip page for the full spec sheet and comparisons to related GPUs.