Quão bem NVIDIA GB200 Superchip escala em múltiplas GPUs?
Resposta
Destaque de desempenho NVIDIA GB200 Superchip: 4,500 TFLOPS FP16, 150 TFLOPS FP32, 16,000 GB/s de largura de banda, 384 GB de VRAM.
Convertido em benchmarks práticos: treinamento de modelo LLM de 7 bilhões de parâmetros em FP16 com tamanhos de lote razoáveis normalmente satura a computação antes da largura de banda; serving em tempo real no mesmo modelo geralmente é limitado pela largura de banda e acompanha o número 16,000 GB/s. Benchmarks de geração de imagens por difusão ficam entre os dois — etapas pesadas em computação utilizam bem os núcleos tensor, enquanto blocos de atenção ainda acessam a largura de banda.
See the NVIDIA GB200 Superchip page for the full spec sheet and comparisons to related GPUs.