Seberapa baik NVIDIA GB200 Superchip skalanya di beberapa GPU?

Jawaban

Judul performa NVIDIA GB200 Superchip: 4,500 TFLOPS FP16, 150 TFLOPS FP32, 16,000 GB/s bandwidth, 384 GB VRAM.

Dikonversi ke benchmark praktis: pelatihan model LLM 7B parameter dalam FP16 dengan ukuran batch wajar biasanya memaksimalkan komputasi sebelum bandwidth; penyajian waktu nyata pada model yang sama biasanya terikat bandwidth dan mengikuti angka 16,000 GB/s. Benchmark generasi gambar difusi berada di antara keduanya — langkah berat komputasi memanfaatkan tensor core dengan baik, sementara blok perhatian masih menggunakan bandwidth.

See the NVIDIA GB200 Superchip page for the full spec sheet and comparisons to related GPUs.

Lebih Banyak FAQ tentang NVIDIA GB200 Superchip

Jelajahi NVIDIA GB200 Superchip