Какова пиковая производительность FP16 у NVIDIA GeForce RTX 3070?

Ответ

Выпущена в 2020, NVIDIA GeForce RTX 3070 — это ускоритель класса Ampere с 8 ГБ GDDR6, пропускной способностью памяти 448 ГБ/с и вычислительной мощностью 20.3 TFLOPS FP16. Пиковая производительность FP32 достигает 10.2 TFLOPS, а потребление энергии — до 220 Вт.

Практически это означает: достаточно видеопамяти для загрузки моделей примерно в диапазоне ~8 миллиардов параметров в FP16 (больше с квантизацией), достаточно пропускной способности, чтобы избежать «голодания» слоёв внимания, и достаточно вычислительной мощности для обучения трансформеров с размерами пакетов, которые насыщают современные оптимизаторы.

See the NVIDIA GeForce RTX 3070 page for the full spec sheet and comparisons to related GPUs.

Дополнительные FAQ по NVIDIA GeForce RTX 3070

Изучить NVIDIA GeForce RTX 3070