Quanto bene scala NVIDIA GB200 Superchip su più GPU?

Risposta

Titolo delle prestazioni di NVIDIA GB200 Superchip: 4,500 TFLOPS FP16, 150 TFLOPS FP32, 16,000 GB/s di larghezza di banda, 384 GB di VRAM.

Convertito in benchmark pratici: l'addestramento di un LLM da 7 miliardi di parametri in FP16 con dimensioni di batch ragionevoli tipicamente satura il calcolo prima della larghezza di banda; il serving in tempo reale sullo stesso modello è solitamente limitato dalla larghezza di banda e segue il valore 16,000 GB/s. I benchmark di generazione di immagini per diffusione si collocano tra i due — le fasi intensive di calcolo utilizzano bene i tensor core, mentre i blocchi di attenzione toccano ancora la larghezza di banda.

See the NVIDIA GB200 Superchip page for the full spec sheet and comparisons to related GPUs.

Altre FAQ su NVIDIA GB200 Superchip

Esplora NVIDIA GB200 Superchip