Vast.ai
Vast.ai é um marketplace bilateral de computação GPU que conecta desenvolvedores a mais de 1.400 hosts independentes oferecendo hardware GPU subutilizado em mais de 500 locais ao redor do mundo. Ao agregar a oferta de data centers independentes e provedores individuais, Vast.ai oferece computação GPU com preços 40–80% menores do que os hiperescaladores tradicionais como AWS, Azure e GCP.
A plataforma suporta três modelos de implantação: GPU Cloud (instâncias individuais), Serverless (pontos de inferência com autoescalonamento) e Clusters (treinamento multinódo). Os usuários podem iniciar instâncias de alto desempenho em segundos usando contêineres Docker, escolhendo entre mais de 35 tipos de GPU que vão desde placas RTX para consumidores até B200s empresariais. Os preços são definidos dinamicamente pelo marketplace com base na oferta e demanda.
Fundada em 2018 por Jake Cannell, a empresa gerencia mais de 20.000 GPUs e alcançou crescimento de 310% em 2024. Possui certificação SOC 2 Tipo 2 e é particularmente popular entre pesquisadores de IA, engenheiros de ML e desenvolvedores independentes que precisam de computação acessível sem compromissos de longo prazo.
GPU Hardware
| GPU Models | B200 H200 H100 SXM H100 NVL A100 SXM A100 PCIe RTX 5090 RTX 5080 RTX 5070 Ti RTX 6000 Pro RTX 6000 Ada RTX 4500 Ada RTX A6000 RTX A5000 RTX A4000 L40S L40 A40 A10 RTX 4090 RTX 4080 RTX 4070 Ti RTX 4070 RTX 4060 Ti RTX 4060 RTX 3090 Ti RTX 3090 RTX 3080 Ti RTX 3080 RTX 3070 Ti RTX 3070 Tesla V100 Tesla T4 A2 GTX 1080 |
| Max VRAM | 192 GB |
| Max GPUs per Instance | 8 |
| Interconnect | NVLink, InfiniBand |
| Multi-Node Training | Sim |
Pricing
| Starting Price | $0.06/hr |
| Billing Granularity | Por segundo |
| Spot/Preemptible | Sim |
| Reserved Discounts | Até 50% (reservado por 1-6 meses) |
| Free Credits | Crédito pequeno para teste na inscrição |
| Egress Fees | Varia conforme o host (R$/TB) |
| Storage | Varia conforme o host (R$/GB/h, cobrado enquanto a instância existir) |
Preços definidos pelo mercado: os anfitriões definem suas próprias tarifas com base na oferta e demanda. Três níveis disponíveis — Sob Demanda (tempo de atividade garantido), Interrompível (mais de 50% mais barato via leilão) e Reservado (contratos de 1/3/6 meses). Orçamento: RTX 4060 a partir de $0,06/h. Médio: RTX 4090 a partir de $0,29/h, A100 a partir de $0,67/h. Topo de linha: H100 a partir de $1,55/h, H200 a partir de $1,97/h, B200 a partir de $2,67/h. Nota: o armazenamento é cobrado mesmo quando as instâncias estão paradas, e taxas de banda são aplicadas por TB. Depósito mínimo de $5 para começar.
Infrastructure
| Regions | Mais de 500 locais, mais de 40 data centers |
| Uptime SLA | Sem SLA formal (pontuações de confiabilidade do host visíveis) |
| Serverless / Autoscaling | Sim |
| Private Networking / VPC | Sim |
Developer Experience
| Pre-installed Frameworks | PyTorch TensorFlow CUDA vLLM ComfyUI |
| Docker Support | Sim |
| SSH Access | Sim |
| Jupyter Notebooks | Sim |
| API / CLI | Sim |
| Setup Time | Segundos |
| Kubernetes Support | Não |
| Custom Images / Templates | Sim |
| Persistent Storage | Sim |
Business Terms
| Min Commitment | Nenhum |
| Compliance | SOC 2 Tipo 2 HIPAA GDPR CCPA |
| Best For | Treinamento de IA inferência ajuste fino Stable Diffusion processamento em lote pesquisa serviço de LLM IA generativa |
| Support Channels | Chat ao vivo (24/7) Discord Email Documentação |
| Payment Methods | Cartão de Crédito Cripto (Coinbase Crypto.com) |
Como ele se compara?
Compare Vast.ai com outros provedores de GPU na nuvem.
Feedback dos usuários
Ainda não há avaliações públicas de usuários para este provedor. Se você já usou seus serviços, seja o primeiro a deixar uma avaliação curta e honesta para ajudar outros desenvolvedores.
Compartilhe Sua Experiência
Feedback curto e honesto ajuda outros desenvolvedores a entender como é realmente usar este provedor.