Quanto bene scala NVIDIA GeForce RTX 3080 Ti su più GPU?

Risposta

Titolo delle prestazioni di NVIDIA GeForce RTX 3080 Ti: 34.1 TFLOPS FP16, 17 TFLOPS FP32, 912 GB/s di larghezza di banda, 12 GB di VRAM.

Convertito in benchmark pratici: l'addestramento di un LLM da 7 miliardi di parametri in FP16 con dimensioni di batch ragionevoli tipicamente satura il calcolo prima della larghezza di banda; il serving in tempo reale sullo stesso modello è solitamente limitato dalla larghezza di banda e segue il valore 912 GB/s. I benchmark di generazione di immagini per diffusione si collocano tra i due — le fasi intensive di calcolo utilizzano bene i tensor core, mentre i blocchi di attenzione toccano ancora la larghezza di banda.

See the NVIDIA GeForce RTX 3080 Ti page for the full spec sheet and comparisons to related GPUs.

Altre FAQ su NVIDIA GeForce RTX 3080 Ti

Esplora NVIDIA GeForce RTX 3080 Ti