Quão bem NVIDIA GeForce RTX 3090 Ti escala em múltiplas GPUs?
Resposta
Destaque de desempenho NVIDIA GeForce RTX 3090 Ti: 40 TFLOPS FP16, 20 TFLOPS FP32, 1,008 GB/s de largura de banda, 24 GB de VRAM.
Convertido em benchmarks práticos: treinamento de modelo LLM de 7 bilhões de parâmetros em FP16 com tamanhos de lote razoáveis normalmente satura a computação antes da largura de banda; serving em tempo real no mesmo modelo geralmente é limitado pela largura de banda e acompanha o número 1,008 GB/s. Benchmarks de geração de imagens por difusão ficam entre os dois — etapas pesadas em computação utilizam bem os núcleos tensor, enquanto blocos de atenção ainda acessam a largura de banda.
Review full specs and related comparisons on the NVIDIA GeForce RTX 3090 Ti page.