Quanto bene scala NVIDIA GeForce RTX 3090 Ti su più GPU?

Risposta

Titolo delle prestazioni di NVIDIA GeForce RTX 3090 Ti: 40 TFLOPS FP16, 20 TFLOPS FP32, 1,008 GB/s di larghezza di banda, 24 GB di VRAM.

Convertito in benchmark pratici: l'addestramento di un LLM da 7 miliardi di parametri in FP16 con dimensioni di batch ragionevoli tipicamente satura il calcolo prima della larghezza di banda; il serving in tempo reale sullo stesso modello è solitamente limitato dalla larghezza di banda e segue il valore 1,008 GB/s. I benchmark di generazione di immagini per diffusione si collocano tra i due — le fasi intensive di calcolo utilizzano bene i tensor core, mentre i blocchi di attenzione toccano ancora la larghezza di banda.

Review full specs and related comparisons on the NVIDIA GeForce RTX 3090 Ti page.

Altre FAQ su NVIDIA GeForce RTX 3090 Ti

Esplora NVIDIA GeForce RTX 3090 Ti