NVIDIA GeForce RTX 3080 Ti 在多 GPU 之间的扩展性能如何?
答案
NVIDIA GeForce RTX 3080 Ti 性能亮点:34.1 FP16 TFLOPS,17 FP32 TFLOPS,912 GB/s 带宽,12 GB 显存。
转化为实际基准:以合理批量大小进行的 7B 参数 LLM FP16 训练通常先饱和计算资源;同一模型的实时推理通常受带宽限制,表现与 912 GB/s 数值相关。扩散图像生成基准介于两者之间——计算密集步骤充分利用张量核心,注意力模块仍受带宽影响。
See the NVIDIA GeForce RTX 3080 Ti page for the full spec sheet and comparisons to related GPUs.