Seberapa baik NVIDIA GeForce RTX 3090 Ti skalanya di beberapa GPU?

Jawaban

Judul performa NVIDIA GeForce RTX 3090 Ti: 40 TFLOPS FP16, 20 TFLOPS FP32, 1,008 GB/s bandwidth, 24 GB VRAM.

Dikonversi ke benchmark praktis: pelatihan model LLM 7B parameter dalam FP16 dengan ukuran batch wajar biasanya memaksimalkan komputasi sebelum bandwidth; penyajian waktu nyata pada model yang sama biasanya terikat bandwidth dan mengikuti angka 1,008 GB/s. Benchmark generasi gambar difusi berada di antara keduanya — langkah berat komputasi memanfaatkan tensor core dengan baik, sementara blok perhatian masih menggunakan bandwidth.

Review full specs and related comparisons on the NVIDIA GeForce RTX 3090 Ti page.

Lebih Banyak FAQ tentang NVIDIA GeForce RTX 3090 Ti

Jelajahi NVIDIA GeForce RTX 3090 Ti