NVIDIA GeForce RTX 4060 Ti cargas de trabajo limitadas por memoria vs limitadas por computación
Respuesta
Titular de rendimiento de NVIDIA GeForce RTX 4060 Ti: 22.1 TFLOPS FP16, 11 TFLOPS FP32, 288 GB/s de ancho de banda, 16 GB de VRAM.
Convertido en benchmarks prácticos: entrenar un LLM de 7 mil millones de parámetros en FP16 con tamaños de lote razonables típicamente satura el cómputo antes que el ancho de banda; el servicio en tiempo real en el mismo modelo usualmente está limitado por el ancho de banda y sigue la cifra de 288 GB/s. Los benchmarks de generación de imágenes por difusión se sitúan entre ambos — los pasos intensivos en cómputo utilizan bien los núcleos tensoriales, mientras que los bloques de atención aún usan ancho de banda.
The NVIDIA GeForce RTX 4060 Ti page has the complete datasheet and side-by-side comparisons.