Cloud-GPU-Anbieter ohne Egress-Gebühren
Egress-Gebühren — Kosten für die Übertragung von Daten aus der Cloud — können unerwartet hohe Zusatzkosten verursachen, wenn Modellgewichte exportiert, Inferenz-Ergebnisse bereitgestellt oder Datensätze zwischen Anbietern verschoben werden. Anbieter ohne Egress-Gebühren bieten vorhersehbare Preise und erleichtern die Umsetzung von Multi-Cloud-Strategien. Dieser Leitfaden stellt GPU-Cloud-Anbieter vor, die keine Gebühren für ausgehenden Datentransfer erheben.
Für diese Anleitung wurden noch keine passenden GPU-Anbieter gefunden. Schauen Sie bald wieder vorbei.
Was “zero egress fees” tatsächlich bedeutet, wenn Sie Cloud-GPUs mieten
Egress ist der Datenverkehr, der das Netzwerk eines Anbieters verlässt — die Bytes, die Sie aus der Cloud auf Ihren Laptop, in eine andere Cloud oder zu Endbenutzern herunterladen. Viele Infrastrukturplattformen messen diesen Datenverkehr und berechnen pro Gigabyte, während sie für Ingress (eingehende Daten) wenig oder gar nichts berechnen. Ein “zero egress” oder “$0 egress” GPU-Host verspricht, dass das Herunterziehen Ihrer Daten keine zusätzlichen Kosten verursacht, außer der bereits gemieteten Rechenleistung. Auf einer GPU-Plattform ist dies ein bedeutender Unterschied, da KI- und Rendering-Workloads ungewöhnlich datenintensiv beim Ausgang sind: Modell-Checkpoints, exportierte Gewichte, gerenderte Frames, Batch-Inferenz-Ergebnisse und synthetische Datensätze müssen alle irgendwohin übertragen werden, sobald die GPU fertig ist.
Der Grund, warum Egress überhaupt separat berechnet wird, ist, dass die Bandbreite zum öffentlichen Internet für Anbieter eine echte Kostenstelle darstellt. Plattformen, die keine Egress-Gebühren werben, tragen diese Kosten entweder in den stündlichen GPU-Preis ein, operieren in einem Netzwerk, in dem der Transit günstig ist, oder beschränken den kostenlosen Transfer auf den Datenverkehr, der innerhalb ihres eigenen Backbones bleibt. Zu verstehen, welche dieser Bedingungen für jeden Eintrag im obigen Vergleich gilt, ist das ganze Spiel.
Warum Egress für echte GPU-Workflows wichtig ist
Der Stundenpreis einer GPU ist nur eine Position auf der Rechnung. Bei datenintensiven Jobs kann der Transfer stillschweigend zur zweiten Rechnung werden — und im Gegensatz zur Rechenleistung ist er schwer vorherzusagen. Egress-Gebühren schlagen besonders bei diesen Mustern zu:
- Training, das große Checkpoints exportiert — Multi-Milliarden-Parameter-Modelle erzeugen Checkpoints, die in Zehner- oder Hunderter-Gigabyte gemessen werden. Wenn Sie häufig Snapshots erstellen und jeden davon außerhalb der Plattform kopieren, kann der gemessene Egress die GPU-Kosten übersteigen.
- High-Throughput-Batch-Inferenz — das Erzeugen von Embeddings, Beschriftungen oder transformierten Medien für Millionen von Elementen bedeutet, dass das Output-Volumen das Input-Volumen übersteigen kann. Dieses Output ist Egress, sobald es den Anbieter verlässt.
- Rendering und Video — fertige Frames und kodierte Videos sind groß und werden fast immer zurück zu Speicher oder Auslieferung gezogen, was Rendering zu einem der egress-sensibelsten GPU-Workloads macht.
- Multi-Cloud- und Hybrid-Pipelines — das Verschieben eines Datensatzes oder Modells zwischen einem GPU-Host und einem separaten Objektspeicher, Vektordatenbank oder Serving-Tier überschreitet jedes Mal eine Netzwerkgrenze, und jede Überschreitung kann gemessen werden.
- Modelle für echte Nutzer bereitstellen — wenn die GPU-Box selbst API-Anfragen beantwortet, ist jeder Antwort-Token oder jedes Bild, das an einen Client gestreamt wird, Egress.
Zero Egress entfernt den Teil der Rechnung, der mit der tatsächlichen Nutzung der Ergebnisse Ihrer Rechenleistung skaliert. Für Experimente ist das kaum spürbar; für Produktions-Pipelines, die Gigabytes pro Stunde verschicken, kann es den Unterschied zwischen zwei Anbietern ausmachen, deren stündliche GPU-Preise identisch erschienen.
Das Kleingedruckte hinter “kein Egress”
Nicht jede “kostenlose Egress”-Angabe deckt dasselbe ab, und die Sternchen sind der Punkt, an dem Käufer überrascht werden. Beim Vergleich der obenstehenden Einträge prüfen Sie genau, was ein Anbieter meint:
- Wirklich ungemessener öffentlicher Egress — jeder Download ins offene Internet ist kostenlos, ohne Gebühr pro GB. Dies ist die stärkste Form und die nützlichste für den Produktionseinsatz.
- Nur kostenloser interner Egress — der Transfer ist kostenlos, solange er innerhalb der eigenen Region oder des Backbones des Anbieters bleibt, aber das Verlassen zum öffentlichen Internet oder einer anderen Cloud wird weiterhin berechnet. Nur nützlich, wenn Speicher und Rechenleistung beim selben Anbieter liegen.
- Ein großzügiges Freikontingent, danach Messung — eine feste Anzahl kostenloser Gigabyte oder Terabyte pro Monat, danach gelten normale Egress-Preise. Gut für kleine Jobs, eine Falle für große Volumen.
- Bandbreitenbegrenztes “kostenlos” — keine Gebühr pro GB, aber die Portgeschwindigkeit wird gedrosselt, sodass große Transfers langsam statt teuer sind. Sie zahlen mit Echtzeit statt mit Geld.
- Egress kostenlos, aber Storage-Egress separat — das Herunterziehen von angehängtem Blockspeicher kann kostenlos sein, während das Herunterziehen von separatem Objektspeicher nicht kostenlos ist. Die Grenze ist, was berechnet wird.
Es gibt einen echten Kompromiss abzuwägen. Ein Anbieter, der kostenlosen Egress bündelt, kann einen etwas höheren stündlichen GPU-Preis haben, da diese Bandbreitenkosten irgendwo untergebracht werden müssen. Für einen egress-armen Workload — lange Trainingsläufe, die Checkpoints behalten, oder interaktive Notebook-Arbeit — kann es insgesamt günstiger sein, einen niedrigeren Stundenpreis mit gemessenem Egress zu zahlen, den Sie nie auslösen. Die richtige Wahl hängt vollständig von Ihrem Output-zu-Compute-Verhältnis ab.
Was Sie vor der Entscheidung prüfen sollten
- Ob kostenloser Egress für öffentlichen Internetverkehr gilt oder nur für intra-provider Transfer.
- Ob es eine monatliche Obergrenze für das kostenlose Kontingent gibt und wie hoch der Preis pro GB ist, wenn Sie diese überschreiten.
- Die Port-/Bandbreitenbegrenzung, da “kostenlos aber langsam” Sie GPU-Stunden kostet, während die Daten übertragen werden.
- Ob Speicherabruf (Objektspeicher-Lesezugriffe, Snapshot-Exporte) separat vom Netzwerkeingang als Egress gezählt wird.
- Wie die Richtlinie mit Spot- oder unterbrechbaren Instanzen interagiert — Sie müssen Daten möglicherweise schnell evakuieren, wenn ein Knoten zurückgenommen wird, und gemessener Egress unter Zeitdruck ist schmerzhaft.
Den obigen Vergleich für Egress lesen
Schätzen Sie Ihren Egress, bevor Sie die Tabelle lesen: ungefähr wie viele Gigabyte pro Lauf die Plattform verlassen, multipliziert mit der Anzahl der Läufe pro Monat. Kombinieren Sie das mit dem oben gezeigten stündlichen GPU-Preis. Ein Host mit zero egress und einem geringfügig höheren Stundenpreis gewinnt oft bei Produktionseinsatz, Batch-Inferenz und Rendering, wo das Output-Volumen hoch und vorhersehbar ist. Für trainingsintensive, output-leichte Arbeit wägen Sie zuerst den niedrigeren Stundenpreis ab und betrachten Egress als sekundären Faktor. Da sich sowohl Bandbreitenrichtlinien als auch Preise ändern, verwenden Sie den obigen Live-Vergleich für die aktuellen Stundenpreise und bestätigen Sie die Egress-Bedingungen jedes Anbieters anhand der hier aufgeführten Punkte.
Häufig gestellte Fragen
Bedeutet “zero egress”, dass mein gesamter Datentransfer kostenlos ist?
Nicht immer. Es bedeutet zuverlässig, dass ausgehender Datenverkehr keine Gebühr pro Gigabyte verursacht, aber einige Anbieter beschränken das auf Verkehr, der innerhalb ihres eigenen Netzwerks bleibt, oder beinhalten nur ein festes monatliches Kontingent, bevor die Messung beginnt. Eingehender Transfer (Ingress) ist fast überall kostenlos, daher ist die Egress-Aussage der Teil, der überprüft werden sollte.
Wie stark können Egress-Gebühren realistisch die GPU-Rechnung erhöhen?
Das hängt vollständig vom Output-Volumen ab. Einige experimentelle Notebooks erzeugen vernachlässigbaren Egress, sodass die Gebühr eine Rundungsdifferenz ist. Eine Produktions-Pipeline, die große Checkpoints exportiert, Videos rendert oder Modellantworten an Nutzer liefert, kann Terabytes pro Monat bewegen, wobei gemessener Egress einen erheblichen Anteil der Gesamtkosten ausmachen kann — manchmal nahe an den Compute-Kosten selbst.
Sollte ich immer einen Zero-Egress-Anbieter wählen?
Nein. Kostenloser Egress geht manchmal mit einem etwas höheren stündlichen GPU-Preis einher. Wenn Ihr Workload Daten an Ort und Stelle hält — lange Trainingsläufe, interaktive Entwicklung — zahlen Sie möglicherweise insgesamt weniger mit einem günstigeren Stundenpreis und gemessenem Egress, den Sie selten auslösen. Passen Sie die Richtlinie an Ihr Output-zu-Compute-Verhältnis an, statt Zero Egress automatisch als besser zu betrachten.
Wird kostenloser Egress jemals gedrosselt?
Ja. Einige Anbieter bieten keine Gebühr pro Gigabyte, begrenzen aber die Portgeschwindigkeit, sodass ein großer Export langsam statt teuer ist. Da die GPU-Uhr weiterlaufen kann, während Daten übertragen werden, hat “kostenlos aber langsam” dennoch reale Kosten in GPU-Stunden. Prüfen Sie immer die Bandbreitenbegrenzung zusammen mit der Preisgestaltung.