¿Qué tan bien escala NVIDIA RTX 4500 Ada en múltiples GPUs?
Respuesta
Titular de rendimiento de NVIDIA RTX 4500 Ada: 31.7 TFLOPS FP16, 23.8 TFLOPS FP32, 432 GB/s de ancho de banda, 24 GB de VRAM.
Convertido en benchmarks prácticos: entrenar un LLM de 7 mil millones de parámetros en FP16 con tamaños de lote razonables típicamente satura el cómputo antes que el ancho de banda; el servicio en tiempo real en el mismo modelo usualmente está limitado por el ancho de banda y sigue la cifra de 432 GB/s. Los benchmarks de generación de imágenes por difusión se sitúan entre ambos — los pasos intensivos en cómputo utilizan bien los núcleos tensoriales, mientras que los bloques de atención aún usan ancho de banda.
Full specs, benchmarks, and comparisons are on the NVIDIA RTX 4500 Ada page.