Быстрее ли NVIDIA GeForce RTX 3070 Ti A100 для дообучения?

Ответ

Пиковая вычислительная мощность NVIDIA GeForce RTX 3070 Ti достигает 21.7 FP16 TFLOPS и 10.8 FP32 TFLOPS, с пропускной способностью памяти 608 ГБ/с, питающей вычислительные блоки. Архитектура Ampere включает тензорные ядра, оптимизированные для смешанной точности BF16/FP16 / FP8 — форматов, наиболее важных для современных трансформеров.

Реальная пропускная способность при обучении моделей масштабируется близко к теоретическим пикам при больших размерах пакетов; меньшие пакеты ограничены пропускной способностью памяти. Для инференса с низкой задержкой количество токенов в секунду на трансформерах, таких как Llama 70B, сильно зависит от стратегии квантизации — FP8/INT8 раскрывают потолок вычислительной мощности, FP16 ограничен пропускной способностью.

Review full specs and related comparisons on the NVIDIA GeForce RTX 3070 Ti page.

Дополнительные FAQ по NVIDIA GeForce RTX 3070 Ti

Изучить NVIDIA GeForce RTX 3070 Ti