Seberapa baik NVIDIA GeForce RTX 3090 Ti skalanya di beberapa GPU?
Jawaban
Judul performa NVIDIA GeForce RTX 3090 Ti: 40 TFLOPS FP16, 20 TFLOPS FP32, 1,008 GB/s bandwidth, 24 GB VRAM.
Dikonversi ke benchmark praktis: pelatihan model LLM 7B parameter dalam FP16 dengan ukuran batch wajar biasanya memaksimalkan komputasi sebelum bandwidth; penyajian waktu nyata pada model yang sama biasanya terikat bandwidth dan mengikuti angka 1,008 GB/s. Benchmark generasi gambar difusi berada di antara keduanya — langkah berat komputasi memanfaatkan tensor core dengan baik, sementara blok perhatian masih menggunakan bandwidth.
Review full specs and related comparisons on the NVIDIA GeForce RTX 3090 Ti page.