NVIDIA GH200 Superchip ดีพอสำหรับการใช้งานจริงในการสืบค้นหรือไม่?

คำตอบ

คำตอบสั้น: NVIDIA GH200 Superchip ทำงานที่ 989 FP16 TFLOPS พร้อมแบนด์วิดท์หน่วยความจำ 4,000 GB/s คำตอบยาวขึ้นขึ้นอยู่กับสิ่งที่คุณใช้งาน

สำหรับการฝึกสอน FP16 หนาแน่นด้วยแบตช์ใหญ่ NVIDIA GH200 Superchip จะเต็มประสิทธิภาพ tensor cores และให้ throughput ใกล้เคียงกับ FLOPS สูงสุด สำหรับการให้บริการที่จำกัดด้วยหน่วยความจำบนโมเดลพื้นฐานที่มีบริบทยาว แบนด์วิดท์เป็นปัจจัยหลัก — ตัวเลข 4,000 GB/s มีความสำคัญมากกว่าค่า FLOPS ที่ประกาศ สำหรับการคำนวณทางวิทยาศาสตร์ FP32 ที่ 494.5 TFLOPS เป็นตัวเลขที่เกี่ยวข้องและวาง NVIDIA GH200 Superchip ให้อยู่ในระดับที่คาดหวังของ HPC ในกลุ่ม Hopper

Check the NVIDIA GH200 Superchip page for complete specifications and related GPU matchups.

คำถามที่พบบ่อยเพิ่มเติมเกี่ยวกับ NVIDIA GH200 Superchip

สำรวจ NVIDIA GH200 Superchip