Vast.ai
Vast.ai adalah pasaran pengkomputeran GPU dua hala yang menghubungkan pembangun dengan lebih 1,400 hos bebas yang menawarkan perkakasan GPU yang kurang digunakan di lebih 500 lokasi di seluruh dunia. Dengan mengagregat bekalan dari pusat data bebas dan penyedia individu, Vast.ai menyediakan pengkomputeran GPU pada harga 40–80% lebih rendah daripada hyperscalers tradisional seperti AWS, Azure, dan GCP.
Platform ini menyokong tiga model penyebaran: GPU Cloud (instans individu), Serverless (titik inferens autoskala), dan Clusters (latihan multi-node). Pengguna boleh memulakan instans berprestasi tinggi dalam beberapa saat menggunakan kontena Docker, memilih daripada lebih 35 jenis GPU yang merangkumi kad RTX pengguna hingga B200 perusahaan. Harga ditetapkan secara dinamik oleh pasaran berdasarkan bekalan dan permintaan.
Ditubuhkan pada tahun 2018 oleh Jake Cannell, syarikat ini mengurus lebih 20,000 GPU dan mencapai pertumbuhan 310% pada tahun 2024. Ia memegang pensijilan SOC 2 Jenis 2 dan sangat popular di kalangan penyelidik AI, jurutera ML, dan pembangun indie yang memerlukan pengkomputeran mampu milik tanpa komitmen jangka panjang.
GPU Hardware
| GPU Models | B200 H200 H100 SXM H100 NVL A100 SXM A100 PCIe RTX 5090 RTX 5080 RTX 5070 Ti RTX 6000 Pro RTX 6000 Ada RTX 4500 Ada RTX A6000 RTX A5000 RTX A4000 L40S L40 A40 A10 RTX 4090 RTX 4080 RTX 4070 Ti RTX 4070 RTX 4060 Ti RTX 4060 RTX 3090 Ti RTX 3090 RTX 3080 Ti RTX 3080 RTX 3070 Ti RTX 3070 Tesla V100 Tesla T4 A2 GTX 1080 |
| Max VRAM | 192 GB |
| Max GPUs per Instance | 8 |
| Interconnect | NVLink, InfiniBand |
| Multi-Node Training | Ya |
Pricing
| Starting Price | $0.06/hr |
| Billing Granularity | Per saat |
| Spot/Preemptible | Ya |
| Reserved Discounts | Sehingga 50% (tempahan 1-6 bulan) |
| Free Credits | Kredit ujian kecil semasa pendaftaran |
| Egress Fees | Berbeza mengikut hos (RM/TB) |
| Storage | Berbeza mengikut hos (RM/GB/jam, dikenakan semasa instans wujud) |
Penetapan harga berdasarkan pasaran: hos menetapkan kadar mereka sendiri berdasarkan penawaran dan permintaan. Tiga tahap tersedia — Permintaan (jaminan masa operasi), Boleh Dihentikan (lebih murah 50%+ melalui bidaan), dan Tempahan (tempoh 1/3/6 bulan). Bajet: RTX 4060 dari $0.06/jam. Pertengahan: RTX 4090 dari $0.29/jam, A100 dari $0.67/jam. Tinggi: H100 dari $1.55/jam, H200 dari $1.97/jam, B200 dari $2.67/jam. Nota: storan dikenakan caj walaupun apabila instans dihentikan, dan yuran jalur lebar dikenakan setiap TB. Deposit minimum $5 untuk mula.
Infrastructure
| Regions | 500+ lokasi, 40+ pusat data |
| Uptime SLA | Tiada SLA rasmi (skor kebolehpercayaan hos boleh dilihat) |
| Serverless / Autoscaling | Ya |
| Private Networking / VPC | Ya |
Developer Experience
| Pre-installed Frameworks | PyTorch TensorFlow CUDA vLLM ComfyUI |
| Docker Support | Ya |
| SSH Access | Ya |
| Jupyter Notebooks | Ya |
| API / CLI | Ya |
| Setup Time | Saat |
| Kubernetes Support | Tidak |
| Custom Images / Templates | Ya |
| Persistent Storage | Ya |
Business Terms
| Min Commitment | Tiada |
| Compliance | SOC 2 Jenis 2 HIPAA GDPR CCPA |
| Best For | Latihan AI inferens penalaan halus Stable Diffusion pemprosesan kelompok penyelidikan perkhidmatan LLM AI generatif |
| Support Channels | Sembang Langsung (24/7) Discord E-mel Dokumentasi |
| Payment Methods | Kad Kredit Kripto (Coinbase Crypto.com) |
Bagaimana perbandingannya?
Bandingkan Vast.ai dengan penyedia GPU awan lain.
Maklum Balas Pengguna
Tiada ulasan pengguna awam untuk penyedia ini lagi. Jika anda pernah menggunakan perkhidmatan mereka, jadilah yang pertama meninggalkan ulasan ringkas dan jujur serta membantu pembangun lain.
Kongsi Pengalaman Anda
Maklum balas ringkas dan jujur membantu pembangun lain memahami bagaimana sebenarnya menggunakan penyedia ini.