NVIDIA GeForce RTX 3090 Ti mở rộng tốt như thế nào trên nhiều GPU?
Trả lời
Tiêu đề hiệu năng NVIDIA GeForce RTX 3090 Ti: 40 TFLOPS FP16, 20 TFLOPS FP32, băng thông 1,008 GB/s, VRAM 24 GB.
Chuyển đổi thành các điểm chuẩn thực tế: huấn luyện mô hình LLM 7 tỷ tham số ở FP16 với kích thước lô hợp lý thường bão hòa tính toán trước băng thông; phục vụ thời gian thực trên cùng mô hình thường bị giới hạn bởi băng thông và theo sát con số 1,008 GB/s. Điểm chuẩn tạo ảnh khuếch tán nằm giữa hai mức đó — các bước nặng tính toán tận dụng tốt tensor core, trong khi các khối attention vẫn sử dụng băng thông.
Review full specs and related comparisons on the NVIDIA GeForce RTX 3090 Ti page.