생산 환경 추론에 NVIDIA GH200 Superchip가 충분한가요?

답변

간단한 답변: NVIDIA GH200 Superchip는 989 FP16 TFLOPS와 4,000 GB/s 메모리 대역폭으로 작동합니다. 더 긴 답변은 실행하는 작업에 따라 다릅니다.

대형 배치의 조밀한 FP16 학습에서는 NVIDIA GH200 Superchip가 텐서 코어를 포화시키며 최고 FLOPS에 가까운 처리량을 제공합니다. 장기 컨텍스트 기초 모델의 메모리 제한 서빙에서는 대역폭이 지배적이며 — 4,000 GB/s 수치가 FP16 TFLOPS보다 더 중요합니다. 과학 계산에서는 494.5 TFLOPS의 FP32가 관련 수치이며, NVIDIA GH200 Superchip를 Hopper 계층의 HPC 기대치에 부합하게 만듭니다.

Check the NVIDIA GH200 Superchip page for complete specifications and related GPU matchups.

NVIDIA GH200 Superchip에 대한 추가 FAQ

NVIDIA GH200 Superchip 탐색