क्या NVIDIA GB200 Superchip BF16 और FP8 का समर्थन करता है?

उत्तर

पूरा NVIDIA GB200 Superchip स्पेक शीट पढ़ता है: Blackwell पीढ़ी, 384 जीबी HBM3e VRAM, 16,000 जीबी/सेकंड मेमोरी बैंडविड्थ, 4,500 TFLOPS FP16, 150 TFLOPS FP32, 2,700W पावर ड्रॉ, 2024 में रिलीज़।

मेमोरी आमतौर पर बड़े मॉडल वास्तविक-समय सेवा के लिए बाधा होती है — 384 जीबी में, NVIDIA GB200 Superchip आराम से FP16 में मध्यम आकार के ट्रांसफॉर्मर और FP8/INT8 में बहुत बड़े मॉडल संभालता है। 16,000 जीबी/सेकंड आंकड़ा विशेष रूप से KV-कैश-सीमित ऑटोरिग्रेसिव डिकोडिंग के लिए महत्वपूर्ण है, जहां मेमोरी बैंडविड्थ टोकन/सेकंड को कच्चे कंप्यूट से अधिक सीमित करता है।

Full specs, benchmarks, and comparisons are on the NVIDIA GB200 Superchip page.

NVIDIA GB200 Superchip के बारे में अधिक FAQs

NVIDIA GB200 Superchip एक्सप्लोर करें