Támogatja-e NVIDIA GB200 Superchip a BF16 és FP8 formátumokat?

Válasz

A teljes NVIDIA GB200 Superchip specifikáció így szól: Blackwell generáció, 384 GB HBM3e VRAM, 16,000 GB/s memória sávszélesség, 4,500 TFLOPS FP16, 150 TFLOPS FP32, 2,700W fogyasztás, megjelent 2024.

A memória általában a korlát a nagy modellek valós idejű kiszolgálásánál — 384 GB-val NVIDIA GB200 Superchip kényelmesen kezeli a közepes méretű transzformereket FP16-ban és sokkal nagyobb modelleket FP8/INT8-ban. A 16,000 GB/s érték különösen fontos a KV-cache-korlátozott autoregresszív dekódolásnál, ahol a memória sávszélesség korlátozza a tokenek/másodperc számát jobban, mint a nyers számítási teljesítmény.

Full specs, benchmarks, and comparisons are on the NVIDIA GB200 Superchip page.

További GYIK-ek a(z) NVIDIA GB200 Superchip témában

Fedezd fel a(z) NVIDIA GB200 Superchip témát