Randamentul pre-antrenamentului NVIDIA GeForce RTX 5080 — la ce să mă aștept?
Răspuns
NVIDIA GeForce RTX 5080 oferă 56 TFLOPS FP16, 28 TFLOPS FP32 și le alimentează cu 16 GB VRAM la 960 GB/s.
Benchmark-uri: antrenamentul LLM cu precizie mixtă vede o utilizare aproape maximă a FLOPS la dimensiuni de lot care încap în VRAM; inferența LLM este de obicei în intervalul 5-15% față de plafonul teoretic limitat de bandă la decodarea autoregresivă; modelele de difuzie arată cea mai mare creștere față de acceleratoarele mai vechi, unde kernel-urile de atenție mai rapide se adaugă câștigurilor brute de calcul.
The NVIDIA GeForce RTX 5080 page has the complete datasheet and side-by-side comparisons.