複数GPUでのNVIDIA GB200 Superchipのスケーリング性能は?

回答

NVIDIA GB200 Superchip の性能概要:4,500 FP16 TFLOPS、150 FP32 TFLOPS、16,000 GB/s 帯域幅、384 GB VRAM。

実用的なベンチマークに換算すると、7BパラメータのLLMをFP16で合理的なバッチサイズでトレーニングすると、通常は帯域幅より先に計算性能が飽和します。同じモデルのリアルタイムサービングは通常帯域幅制限で、16,000 GB/s の数値に追随します。拡散画像生成ベンチマークは両者の中間に位置し、計算負荷の高いステップはテンソルコアをよく活用し、アテンションブロックは帯域幅にアクセスします。

See the NVIDIA GB200 Superchip page for the full spec sheet and comparisons to related GPUs.

NVIDIA GB200 Superchipに関するさらに多くのFAQ

NVIDIA GB200 Superchipを探る