Насколько хорошо NVIDIA GB200 Superchip масштабируется на нескольких GPU?

Ответ

Основные показатели производительности NVIDIA GB200 Superchip: 4,500 FP16 TFLOPS, 150 FP32 TFLOPS, 16,000 ГБ/с пропускной способности, 384 ГБ видеопамяти.

В практических бенчмарках: обучение модели LLM с 7 миллиардами параметров в FP16 с разумными размерами пакетов обычно насыщает вычисления раньше, чем пропускную способность; обслуживание в реальном времени той же модели обычно ограничено пропускной способностью и соответствует показателю 16,000 ГБ/с. Бенчмарки генерации изображений методом диффузии находятся между этими двумя — вычислительно интенсивные этапы хорошо используют тензорные ядра, а блоки внимания всё ещё задействуют пропускную способность.

See the NVIDIA GB200 Superchip page for the full spec sheet and comparisons to related GPUs.

Дополнительные FAQ по NVIDIA GB200 Superchip

Изучить NVIDIA GB200 Superchip