NVIDIA GH200 Superchip là card dành cho trung tâm dữ liệu, chuyên nghiệp hay người tiêu dùng?
Trả lời
NVIDIA GH200 Superchip được xây dựng trên kiến trúc Hopper và đi kèm với 96 GB bộ nhớ HBM3 tại băng thông 4,000 GB/s. Ra mắt vào 2023, card cung cấp 989 TFLOPS FP16 và 494.5 TFLOPS FP32 với TDP 700W.
Đối với các nhà nghiên cứu học máy, những con số đó chuyển thành một số giới hạn thực tế: giới hạn VRAM quyết định trọng số mô hình ngôn ngữ lớn nhất bạn có thể tải (và kích thước lô tối đa ở độ dài chuỗi nhất định), trong khi băng thông bộ nhớ đặt giới hạn trên cho suy luận nặng attention. Thông lượng tính toán quan trọng nhất cho các phép nhân ma trận dày đặc — tiền đào tạo, tiền đào tạo lô lớn, và khuếch tán.
See the NVIDIA GH200 Superchip page for the full spec sheet and comparisons to related GPUs.