GPU Đám mây Tốt nhất cho AI Inference — May 2026
GPU Đám mây tối ưu cho phục vụ — thông lượng cao trên mỗi đồng đô la, độ trễ thấp, hỗ trợ đa dạng khung làm việc.
AMD
288 GB
MI350X
HBM3e
CDNA 4
AMD
256 GB
MI325X
HBM3e
CDNA 3
$2.00/hr
NVIDIA
192 GB
B200
HBM3e
Blackwell
$1.99/hr
NVIDIA
192 GB
B100
HBM3e
Blackwell
AMD
192 GB
MI300X
HBM3
CDNA 3
$1.85/hr
NVIDIA
141 GB
H200 SXM
HBM3e
Hopper
$2.05/hr
NVIDIA
80 GB
A100 SXM (80GB)
HBM2e
Ampere
$1.10/hr
NVIDIA
64 GB
A16
GDDR6
Ampere
$0.47/hr
NVIDIA
48 GB
L40S
GDDR6
Ada Lovelace
$0.55/hr
NVIDIA
48 GB
L40
GDDR6
Ada Lovelace
NVIDIA
48 GB
A40
GDDR6
Ampere
$0.30/hr
NVIDIA
40 GB
A100 SXM (40GB)
HBM2e
Ampere
$0.80/hr
NVIDIA
24 GB
A30
HBM2e
Ampere
$0.25/hr
NVIDIA
24 GB
L4
GDDR6
Ada Lovelace
$0.39/hr
NVIDIA
24 GB
A10G
GDDR6
Ampere
NVIDIA
16 GB
V100
HBM2
Volta
$0.13/hr
NVIDIA
16 GB
T4
GDDR6
Turing
$0.08/hr
NVIDIA
16 GB
A2
GDDR6
Ampere
$0.22/hr
NVIDIA
8 GB
P4
GDDR5
Pascal
$0.16/hr
NVIDIA
48 GB
RTX 6000 Ada
GDDR6
Ada Lovelace
$0.47/hr
NVIDIA
48 GB
RTX A6000
GDDR6
Ampere
$0.30/hr
NVIDIA
32 GB
RTX 5000 Ada
GDDR6
Ada Lovelace
NVIDIA
32 GB
RTX 5090
GDDR7
Blackwell
$0.34/hr
NVIDIA
24 GB
RTX 4090
GDDR6X
Ada Lovelace
$0.28/hr
NVIDIA
24 GB
RTX 3090
GDDR6X
Ampere
$0.12/hr
NVIDIA
16 GB
RTX 5080
GDDR7
Blackwell
NVIDIA
16 GB
RTX 4080 SUPER
GDDR6X
Ada Lovelace
NVIDIA
16 GB
RTX 4080
GDDR6X
Ada Lovelace
NVIDIA
16 GB
RTX 5070 Ti
GDDR7
Blackwell
NVIDIA
16 GB
RTX 4060 Ti
GDDR6
Ada Lovelace
NVIDIA
12 GB
RTX 4070 Ti
GDDR6X
Ada Lovelace
NVIDIA
12 GB
RTX 3080 Ti
GDDR6X
Ampere
NVIDIA
12 GB
RTX 4070
GDDR6X
Ada Lovelace
NVIDIA
10 GB
RTX 3080
GDDR6X
Ampere
NVIDIA
8 GB
RTX 3070 Ti
GDDR6X
Ampere
NVIDIA
8 GB
RTX 3070
GDDR6
Ampere
NVIDIA
8 GB
RTX 4060
GDDR6
Ada Lovelace
NVIDIA
8 GB
GTX 1080
GDDR5X
Pascal
MI350X vs MI325X vs B200 — lựa chọn hàng đầu từ hướng dẫn này
|
MI350X
CDNA 4 · 288 GB
|
MI325X
CDNA 3 · 256 GB
|
B200
Blackwell · 192 GB
|
|
|---|---|---|---|
| Thông số kỹ thuật | |||
| Nhà Sản Xuất | AMD | AMD | NVIDIA |
| Kiến Trúc | CDNA 4 | CDNA 3 | Blackwell |
| VRAM | 288 GB HBM3e | 256 GB HBM3e | 192 GB HBM3e |
| Băng Thông | 8,000 GB/s | 6,000 GB/s | 8,000 GB/s |
| FP16 (Tensor) | 1,800 TFLOPS | 1,307 TFLOPS | 2,250 TFLOPS |
| FP32 | 72 TFLOPS | 163.4 TFLOPS | 75 TFLOPS |
| TDP | 1000 W | 1000 W | 1000 W |
| Năm Phát Hành | 2025 | 2024 | 2024 |
| Phân Khúc | Trung tâm dữ liệu | Trung tâm dữ liệu | Trung tâm dữ liệu |
| Giá đám mây | |||
| Rẻ Nhất Theo Yêu Cầu | — | $2.00/hr | $1.99/hr |
| Nhà Cung Cấp | 1 | 2 | 2 |
Tạo so sánh GPU của riêng bạn
Chọn 2 GPU bất kỳ từ hướng dẫn này và mở chúng cạnh nhau.
Mẹo: So sánh GPU chạy theo cặp. Chọn đúng 2 — nếu không chọn, chúng tôi sẽ mở 2 mẫu hàng đầu từ hướng dẫn này.