NVIDIA GeForce RTX 4080 SUPERはH100と比べてどのようなベンチマーク結果ですか?
回答
NVIDIA GeForce RTX 4080 SUPER 性能仕様: 52.4 FP16 TFLOPS / 26.2 FP32 TFLOPS / 736 GB/s / 16 GB。
3つのワークロードクラス、3つの異なるボトルネック:ファインチューニングはFP16/BF16テンソルコアに負荷がかかり(FLOPS制限)、大規模言語モデルのサービングはメモリ帯域幅に負荷がかかり(帯域幅制限)、HPCスタイルのシミュレーションはFP32に負荷がかかります(こちらもFLOPS制限)。NVIDIA GeForce RTX 4080 SUPERはその世代の中でこれら3つすべてを十分にカバーします。ワークロードの比率が特定のクラスに偏る場合は、合成ピーク数値に頼らず、そのワークロードでベンチマークを行ってください。
Review full specs and related comparisons on the NVIDIA GeForce RTX 4080 SUPER page.