NVIDIA GB200 Superchip สามารถขยายการใช้งานข้ามหลาย GPU ได้ดีแค่ไหน?

คำตอบ

หัวข้อประสิทธิภาพ NVIDIA GB200 Superchip: 4,500 FP16 TFLOPS, 150 FP32 TFLOPS, แบนด์วิดท์ 16,000 GB/s, VRAM 384 GB

แปลงเป็นการทดสอบประสิทธิภาพจริง: การฝึกโมเดล LLM ขนาด 7 พันล้านพารามิเตอร์ใน FP16 ด้วยขนาดแบตช์ที่เหมาะสมมักจะเต็มประสิทธิภาพการคำนวณก่อนแบนด์วิดท์; การให้บริการแบบเรียลไทม์บนโมเดลเดียวกันมักถูกจำกัดด้วยแบนด์วิดท์และสอดคล้องกับตัวเลข 16,000 GB/s การทดสอบการสร้างภาพ diffusion อยู่ระหว่างสองแบบ — ขั้นตอนที่เน้นการคำนวณหนักใช้ tensor cores ได้ดี ขณะที่บล็อก attention ยังคงใช้งานแบนด์วิดท์

See the NVIDIA GB200 Superchip page for the full spec sheet and comparisons to related GPUs.

คำถามที่พบบ่อยเพิ่มเติมเกี่ยวกับ NVIDIA GB200 Superchip

สำรวจ NVIDIA GB200 Superchip