Unterstützt NVIDIA GB200 Superchip BF16 und FP8?

Antwort

Das vollständige NVIDIA GB200 Superchip Datenblatt lautet: Blackwell Generation, 384 GB HBM3e VRAM, 16,000 GB/s Speicherbandbreite, 4,500 TFLOPS FP16, 150 TFLOPS FP32, 2,700W Leistungsaufnahme, veröffentlicht im 2024.

Speicher ist typischerweise die Einschränkung für großmodelliges Echtzeit-Serving – mit 384 GB bewältigt NVIDIA GB200 Superchip problemlos mittelgroße Transformer in FP16 und deutlich größere Modelle in FP8/INT8. Die 16,000 GB/s Zahl ist besonders wichtig für KV-Cache-gebundene autoregressive Decodierung, bei der die Speicherbandbreite die Tokens pro Sekunde stärker begrenzt als die rohe Rechenleistung.

Full specs, benchmarks, and comparisons are on the NVIDIA GB200 Superchip page.

Mehr FAQs zu NVIDIA GB200 Superchip

Erkunde NVIDIA GB200 Superchip