Cât de bine se scalează NVIDIA GeForce RTX 3090 Ti pe mai multe GPU-uri?
Răspuns
Titlul performanței NVIDIA GeForce RTX 3090 Ti: 40 TFLOPS FP16, 20 TFLOPS FP32, 1,008 GB/s lățime de bandă, 24 GB VRAM.
Convertit în benchmark-uri practice: antrenarea unui LLM de 7 miliarde de parametri în FP16 cu dimensiuni rezonabile de lot tipic saturează calculul înaintea lățimii de bandă; servirea în timp real pe același model este de obicei limitată de bandă și urmează cifra 1,008 GB/s. Benchmark-urile de generare a imaginilor prin difuzie se situează între cele două — pașii care consumă mult calcul utilizează bine nucleele tensor, în timp ce blocurile de atenție ating încă lățimea de bandă.
Review full specs and related comparisons on the NVIDIA GeForce RTX 3090 Ti page.