推理工作负载与训练有不同的需求:低延迟、高吞吐量和成本效益的扩展。在生产环境中提供预测时,无服务器GPU端点、自动扩展和按秒计费变得至关重要。本指南列出了针对推理优化的云GPU提供商,包括提供无服务器GPU、零扩展部署以及专用于推理的GPU型号如L40S和T4的供应商。
目前尚无匹配此指南的GPU供应商。请稍后再查。
我们使用Cookies以提升您的体验。继续浏览即表示您同意我们的 Cookie政策.