NVIDIA GB200 Superchip có hỗ trợ BF16 và FP8 không?

Trả lời

Bảng thông số kỹ thuật đầy đủ NVIDIA GB200 Superchip ghi: thế hệ Blackwell, 384 GB VRAM HBM3e, băng thông bộ nhớ 16,000 GB/s, TFLOPS FP16 4,500, TFLOPS FP32 150, tiêu thụ điện 2,700W, phát hành vào 2024.

Bộ nhớ thường là giới hạn cho phục vụ thời gian thực mô hình lớn — với 384 GB, NVIDIA GB200 Superchip dễ dàng xử lý các transformer cỡ trung bình ở FP16 và các mô hình lớn hơn nhiều ở FP8/INT8. Con số 16,000 GB/s đặc biệt quan trọng cho giải mã autoregressive bị giới hạn bộ nhớ đệm KV, nơi băng thông bộ nhớ giới hạn số token/giây nhiều hơn tính toán thô.

Full specs, benchmarks, and comparisons are on the NVIDIA GB200 Superchip page.

Thêm câu hỏi thường gặp về NVIDIA GB200 Superchip

Khám phá NVIDIA GB200 Superchip