NVIDIA GB200 Superchip 在多 GPU 之间的扩展性能如何?

答案

NVIDIA GB200 Superchip 性能亮点:4,500 FP16 TFLOPS,150 FP32 TFLOPS,16,000 GB/s 带宽,384 GB 显存。

转化为实际基准:以合理批量大小进行的 7B 参数 LLM FP16 训练通常先饱和计算资源;同一模型的实时推理通常受带宽限制,表现与 16,000 GB/s 数值相关。扩散图像生成基准介于两者之间——计算密集步骤充分利用张量核心,注意力模块仍受带宽影响。

See the NVIDIA GB200 Superchip page for the full spec sheet and comparisons to related GPUs.

更多关于 NVIDIA GB200 Superchip 的常见问题

探索 NVIDIA GB200 Superchip