NVIDIA GB200 Superchip BF16 ve FP8 destekliyor mu?

Cevap

Tam NVIDIA GB200 Superchip teknik özellik sayfası şöyle der: Blackwell nesil, 384 GB HBM3e VRAM, 16,000 GB/s bellek bant genişliği, 4,500 TFLOPS FP16, 150 TFLOPS FP32, 2,700W güç tüketimi, 2024 tarihinde piyasaya sürülmüştür.

Büyük model gerçek zamanlı servisi için bellek genellikle sınırlayıcıdır — 384 GB ile NVIDIA GB200 Superchip, FP16'da orta boy transformerları ve FP8/INT8'de çok daha büyük modelleri rahatlıkla çalıştırır. 16,000 GB/s rakamı, özellikle KV-cache sınırlandırılmış otoregresif çözümlemede önemlidir; burada bellek bant genişliği, saniyedeki token sayısını ham hesaplamadan daha fazla sınırlar.

Full specs, benchmarks, and comparisons are on the NVIDIA GB200 Superchip page.

NVIDIA GB200 Superchip hakkında daha fazla SSS

NVIDIA GB200 Superchip keşfet