이그레스 요금이 없는 클라우드 GPU 제공업체
이그레스 요금은 클라우드 외부로 데이터를 전송할 때 부과되는 비용으로, 모델 가중치 내보내기, 추론 결과 제공 또는 공급자 간 데이터셋 이동 시 예상치 못한 큰 비용이 발생할 수 있습니다. 이그레스 요금이 없는 제공업체는 예측 가능한 가격 정책을 제공하며 멀티 클라우드 전략 채택을 용이하게 합니다. 이 가이드는 아웃바운드 데이터 전송에 요금을 부과하지 않는 GPU 클라우드 제공업체를 소개합니다.
이 가이드에 맞는 GPU 제공업체가 아직 없습니다. 곧 다시 확인해 주세요.
클라우드 GPU를 임대할 때 “제로 이그레스 요금”이 실제로 의미하는 것
이그레스는 공급자의 네트워크를 떠나는 데이터입니다 — 클라우드에서 노트북, 다른 클라우드, 또는 최종 사용자에게 다운로드하는 바이트를 말합니다. 많은 인프라 플랫폼은 이 트래픽을 측정하여 기가바이트당 요금을 부과하며, 인그레스(들어오는 데이터)에 대해서는 거의 또는 전혀 요금을 부과하지 않습니다. “제로 이그레스” 또는 “$0 이그레스” GPU 호스트는 이미 임대한 컴퓨트 비용 외에 데이터를 다시 꺼내는 데 비용이 들지 않는다고 약속합니다. GPU 플랫폼에서는 AI 및 렌더링 작업이 나가는 데이터가 유난히 많기 때문에 이 구분이 의미가 큽니다: 모델 체크포인트, 내보낸 가중치, 렌더링된 프레임, 배치 추론 결과, 합성 데이터셋 등은 GPU 작업이 끝나면 반드시 어딘가로 전송되어야 합니다.
이그레스가 별도로 가격이 책정되는 이유는 공개 인터넷으로의 대역폭이 공급자에게 실제 상류 비용이기 때문입니다. 이그레스 요금이 없다고 광고하는 플랫폼은 해당 비용을 시간당 GPU 요금에 포함시키거나, 전송 비용이 저렴한 네트워크에서 운영하거나, 무료 전송을 자사 백본 내 트래픽으로 제한하는 경우입니다. 위 비교에서 어떤 경우가 적용되는지 파악하는 것이 핵심입니다.
실제 GPU 워크플로우에서 이그레스가 중요한 이유
GPU의 시간당 가격은 청구서의 한 줄일 뿐입니다. 데이터 집약적인 작업에서는 전송 비용이 조용히 두 번째 청구서가 될 수 있으며, 컴퓨트와 달리 사전에 예측하기 어렵습니다. 이그레스 요금이 가장 크게 영향을 미치는 패턴은 다음과 같습니다:
- 대용량 체크포인트를 내보내는 학습 — 수십억 개 매개변수 모델은 수십 또는 수백 기가바이트 단위의 체크포인트를 생성합니다. 자주 스냅샷을 찍고 각각을 플랫폼 외부로 복사하면, 측정된 이그레스가 GPU 비용과 맞먹을 수 있습니다.
- 고처리량 배치 추론 — 수백만 개 항목에 대한 임베딩, 캡션, 변환된 미디어를 생성하면 출력량이 입력을 훨씬 초과할 수 있습니다. 이 출력은 공급자를 떠나는 순간 이그레스가 됩니다.
- 렌더링 및 비디오 — 완성된 프레임과 인코딩된 비디오는 크기가 크고 거의 항상 저장소나 배달로 다시 꺼내기 때문에 렌더링은 이그레스에 가장 민감한 GPU 작업 중 하나입니다.
- 멀티 클라우드 및 하이브리드 파이프라인 — GPU 호스트와 별도의 객체 저장소, 벡터 데이터베이스, 또는 서빙 계층 간에 데이터셋이나 모델을 이동할 때마다 네트워크 경계가 교차하며, 각 교차는 측정될 수 있습니다.
- 실제 사용자에게 모델 서빙 — GPU 박스 자체가 API 요청에 응답한다면, 클라이언트에게 스트리밍되는 모든 응답 토큰이나 이미지가 이그레스입니다.
제로 이그레스는 컴퓨트 결과를 실제로 사용하는 양에 따라 청구서가 증가하는 부분을 제거합니다. 실험 단계에서는 거의 영향을 미치지 않지만, 시간당 기가바이트 단위로 데이터를 전송하는 프로덕션 파이프라인에서는 시간당 GPU 요금이 비슷해 보였던 두 공급자 간의 차이를 만들 수 있습니다.
“무이그레스” 뒤에 숨은 세부사항
모든 “무료 이그레스” 주장이 동일한 범위를 포함하는 것은 아니며, 별표(*)가 구매자를 놀라게 하는 부분입니다. 위 비교 항목을 검토할 때 공급자가 의미하는 바를 정확히 확인하세요:
- 진정한 무측정 공개 이그레스 — 공개 인터넷으로의 모든 다운로드가 무료이며, 기가바이트당 요금이 전혀 없습니다. 이는 가장 강력한 형태이며 프로덕션 서빙에 가장 유용합니다.
- 내부 이그레스만 무료 — 전송이 공급자의 자체 리전이나 백본 내에 머무르는 한 무료이지만, 공개 인터넷이나 다른 클라우드로 나가는 경우는 여전히 요금이 부과됩니다. 저장소와 컴퓨트가 동일 공급자 내에 있을 때만 유용합니다.
- 관대한 무료 할당량 후 측정 — 매월 일정량의 무료 기가바이트 또는 테라바이트가 제공되며, 이를 초과하면 정상 이그레스 요금이 적용됩니다. 소규모 작업에는 적합하지만 대용량 작업에는 함정이 될 수 있습니다.
- 대역폭 제한 “무료” — 기가바이트당 요금은 없지만 포트 속도가 제한되어 대용량 전송이 느리게 진행됩니다. 비용 대신 시간으로 지불하는 셈입니다.
- 이그레스는 무료지만 저장소 이그레스는 별도 — 연결된 블록 저장소에서 끌어오는 것은 무료일 수 있으나, 별도의 객체 저장소에서 끌어오는 것은 요금이 부과됩니다. 경계가 요금 부과 대상입니다.
진정한 트레이드오프가 존재합니다. 무료 이그레스를 포함하는 공급자는 대역폭 비용이 포함되어 시간당 GPU 요금이 약간 더 높을 수 있습니다. 이그레스가 적은 작업 — 체크포인트를 유지하는 장기 학습이나 대화형 노트북 작업 — 에는 낮은 시간당 요금과 거의 발생하지 않는 측정 이그레스가 전체 비용을 더 낮출 수 있습니다. 올바른 선택은 출력 대비 컴퓨트 비율에 전적으로 달려 있습니다.
계약 전에 확인할 사항
- 무료 이그레스가 공개 인터넷 트래픽에 적용되는지 아니면 공급자 내부 전송에만 적용되는지 여부.
- 무료 허용량에 대한 월별 한도와 이를 초과할 경우 적용되는 기가바이트당 요금.
- 포트/대역폭 제한 — “무료지만 느림”은 데이터 전송 중 GPU 시간이 계속 소모되므로 비용이 발생합니다.
- 저장소 조회(객체 저장소 읽기, 스냅샷 내보내기)이 네트워크 이그레스와 별도로 이그레스로 간주되는지 여부.
- 스팟 또는 인터럽트 가능 인스턴스와 정책이 어떻게 상호작용하는지 — 노드가 회수될 때 데이터를 신속히 대피시켜야 할 수 있으며, 기한 내 측정 이그레스는 부담이 될 수 있습니다.
위 비교에서 이그레스 읽기
표를 읽기 전에 이그레스를 추정하세요: 한 번 실행당 플랫폼을 떠나는 기가바이트 수에 월별 실행 횟수를 곱합니다. 위에 표시된 시간당 GPU 요금과 함께 고려하세요. 제로 이그레스에 약간 더 높은 시간당 가격을 가진 호스트가 출력량이 많고 예측 가능한 프로덕션 서빙, 배치 추론, 렌더링에서 종종 우위를 점합니다. 학습이 많고 출력이 적은 작업에는 낮은 시간당 요금을 우선 고려하고 이그레스는 부차적인 요소로 다루세요. 대역폭 정책과 가격은 변동하므로, 위 실시간 비교를 사용해 현재 시간당 요금을 확인하고 각 공급자의 이그레스 조건을 여기 나열된 항목과 대조하세요.
자주 묻는 질문
“제로 이그레스”가 내 모든 데이터 전송이 무료라는 뜻인가요?
항상 그런 것은 아닙니다. 일반적으로 아웃바운드 트래픽에 대한 기가바이트당 요금이 없다는 뜻이지만, 일부 공급자는 이를 자사 네트워크 내 트래픽으로 제한하거나 무료 월별 할당량 이후에 측정 요금을 부과합니다. 인그레스(들어오는 데이터)는 거의 모든 곳에서 무료이므로, 이그레스 주장을 확인하는 것이 중요합니다.
이그레스 요금이 GPU 청구서에 얼마나 크게 추가될 수 있나요?
전적으로 출력량에 달려 있습니다. 몇 개의 실험용 노트북은 이그레스가 무시할 정도로 적어 요금이 거의 없습니다. 대용량 체크포인트를 내보내거나 비디오를 렌더링하거나 사용자에게 모델 응답을 서빙하는 프로덕션 파이프라인은 매월 테라바이트 단위로 데이터를 이동할 수 있으며, 이 경우 측정된 이그레스가 전체 비용의 상당 부분 — 때로는 컴퓨트 비용에 근접할 수 있습니다.
항상 제로 이그레스 공급자를 선택해야 하나요?
아닙니다. 무료 이그레스는 때때로 약간 더 높은 시간당 GPU 요금과 함께 제공됩니다. 작업이 데이터를 제자리에 유지하는 경우 — 장기 학습, 대화형 개발 — 더 낮은 시간당 요금과 거의 발생하지 않는 측정 이그레스로 전체 비용을 줄일 수 있습니다. 제로 이그레스를 자동으로 더 낫다고 여기지 말고 출력 대비 컴퓨트 비율에 맞춰 정책을 선택하세요.
무료 이그레스가 속도 제한되기도 하나요?
네. 일부 공급자는 기가바이트당 요금은 없지만 포트 속도를 제한하여 대용량 내보내기가 느리게 진행됩니다. 데이터 전송 중 GPU 클럭이 계속 작동할 수 있으므로 “무료지만 느림”도 GPU 시간 비용이 발생합니다. 가격과 함께 대역폭 제한도 항상 확인하세요.