NVIDIA GB200 Superchip mở rộng tốt như thế nào trên nhiều GPU?

Trả lời

Tiêu đề hiệu năng NVIDIA GB200 Superchip: 4,500 TFLOPS FP16, 150 TFLOPS FP32, băng thông 16,000 GB/s, VRAM 384 GB.

Chuyển đổi thành các điểm chuẩn thực tế: huấn luyện mô hình LLM 7 tỷ tham số ở FP16 với kích thước lô hợp lý thường bão hòa tính toán trước băng thông; phục vụ thời gian thực trên cùng mô hình thường bị giới hạn bởi băng thông và theo sát con số 16,000 GB/s. Điểm chuẩn tạo ảnh khuếch tán nằm giữa hai mức đó — các bước nặng tính toán tận dụng tốt tensor core, trong khi các khối attention vẫn sử dụng băng thông.

See the NVIDIA GB200 Superchip page for the full spec sheet and comparisons to related GPUs.

Thêm câu hỏi thường gặp về NVIDIA GB200 Superchip

Khám phá NVIDIA GB200 Superchip