複数GPUでのNVIDIA RTX 4500 Adaのスケーリング性能は?
回答
NVIDIA RTX 4500 Ada の性能概要:31.7 FP16 TFLOPS、23.8 FP32 TFLOPS、432 GB/s 帯域幅、24 GB VRAM。
実用的なベンチマークに換算すると、7BパラメータのLLMをFP16で合理的なバッチサイズでトレーニングすると、通常は帯域幅より先に計算性能が飽和します。同じモデルのリアルタイムサービングは通常帯域幅制限で、432 GB/s の数値に追随します。拡散画像生成ベンチマークは両者の中間に位置し、計算負荷の高いステップはテンソルコアをよく活用し、アテンションブロックは帯域幅にアクセスします。
Full specs, benchmarks, and comparisons are on the NVIDIA RTX 4500 Ada page.