Cloud-GPU-Anbieter ohne Ausgehgebühren
Ausgehgebühren — Kosten für die Übertragung von Daten aus der Cloud — können beim Exportieren von Modellgewichten, Bereitstellen von Inferenz-Ergebnissen oder Verschieben von Datensätzen zwischen Anbietern unerwartet hohe Kosten verursachen. Anbieter ohne Ausgehgebühren bieten vorhersehbare Preise und erleichtern die Umsetzung von Multi-Cloud-Strategien. Dieser Leitfaden hebt GPU-Cloud-Anbieter hervor, die keine Gebühren für ausgehenden Datenverkehr erheben.
Für diese Anleitung wurden noch keine passenden GPU-Anbieter gefunden. Schauen Sie bald wieder vorbei.
Was “zero egress fees” tatsächlich bedeutet, wenn Sie Cloud-GPUs mieten
Egress sind die Daten, die das Netzwerk eines Anbieters verlassen — die Bytes, die Sie aus der Cloud auf Ihren Laptop, in eine andere Cloud oder zu Endnutzern herunterladen. Viele Infrastrukturplattformen messen diesen Datenverkehr und berechnen pro Gigabyte, während sie für Ingress (eingehende Daten) wenig oder gar nichts berechnen. Ein “zero egress” oder “$0 egress” GPU-Host verspricht, dass das Herausholen Ihrer Daten keine zusätzlichen Kosten verursacht, außer der bereits gemieteten Rechenleistung. Auf einer GPU-Plattform ist dies ein bedeutender Unterschied, da KI- und Rendering-Workloads ungewöhnlich datenintensiv beim Ausgang sind: Modell-Checkpoints, exportierte Gewichte, gerenderte Frames, Batch-Inferenz-Ergebnisse und synthetische Datensätze müssen alle irgendwohin übertragen werden, sobald die GPU fertig ist.
Der Grund, warum Egress überhaupt separat berechnet wird, ist, dass die Bandbreite zum öffentlichen Internet für Anbieter eine echte Kostenposition darstellt. Plattformen, die keine Egress-Gebühren werben, übernehmen diese Kosten entweder in den stündlichen GPU-Preis, operieren in einem Netzwerk mit günstigen Transitkosten oder beschränken den kostenlosen Transfer auf Datenverkehr, der innerhalb ihres eigenen Backbones bleibt. Zu verstehen, welche dieser Varianten auf jeden Eintrag im obigen Vergleich zutrifft, ist das ganze Spiel.
Warum Egress für echte GPU-Workflows wichtig ist
Der Stundenpreis einer GPU ist nur eine Position auf der Rechnung. Für datenintensive Jobs kann der Transfer still und heimlich zur zweiten Rechnung werden — und im Gegensatz zur Rechenleistung ist er schwer vorherzusagen. Egress-Preise schlagen besonders bei diesen Mustern zu:
- Training, das große Checkpoints exportiert — Modelle mit mehreren Milliarden Parametern erzeugen Checkpoints, die in Dutzenden oder Hunderten von Gigabyte gemessen werden. Wenn Sie häufig Snapshots machen und jeden davon außerhalb der Plattform kopieren, kann gemessener Egress die GPU-Kosten erreichen.
- Batch-Inferenz mit hohem Durchsatz — das Erzeugen von Embeddings, Bildunterschriften oder transformierten Medien für Millionen von Elementen bedeutet, dass das Output-Volumen das Input-Volumen bei weitem übersteigen kann. Dieses Output ist Egress, sobald es den Anbieter verlässt.
- Rendering und Video — fertige Frames und kodierte Videos sind groß und werden fast immer zurück in Speicher oder Auslieferung gezogen, was Rendering zu einem der egress-sensibelsten GPU-Workloads macht.
- Multi-Cloud- und Hybrid-Pipelines — das Verschieben eines Datensatzes oder Modells zwischen einem GPU-Host und einem separaten Objektspeicher, Vektordatenbank oder Servicestufe überschreitet bei jedem Mal eine Netzwerkgrenze, und jede Überschreitung kann gemessen werden.
- Modelle für echte Nutzer bereitstellen — wenn die GPU-Box selbst API-Anfragen beantwortet, ist jeder Antwort-Token oder jedes Bild, das an einen Client gestreamt wird, Egress.
Zero Egress entfernt den Teil der Rechnung, der mit der tatsächlichen Nutzung der Ergebnisse Ihrer Rechenleistung skaliert. Für Experimente ist das kaum spürbar; für Produktionspipelines, die Gigabytes pro Stunde verschicken, kann es den Unterschied zwischen zwei Anbietern ausmachen, deren stündliche GPU-Preise identisch erschienen.
Das Kleingedruckte hinter “kein Egress”
Nicht jede Behauptung über “kostenlosen Egress” deckt dasselbe ab, und die Sternchen sind der Punkt, an dem Käufer überrascht werden. Beim Vergleich der obigen Einträge prüfen Sie genau, was ein Anbieter meint:
- Wirklich ungemessener öffentlicher Egress — jeder Download ins offene Internet ist kostenlos, ohne jegliche Gebühr pro GB. Dies ist die stärkste Form und die nützlichste für die Produktion.
- Nur kostenloser interner Egress — der Transfer ist kostenlos, solange er innerhalb der eigenen Region oder des Backbones des Anbieters bleibt, aber das Verlassen zum öffentlichen Internet oder einer anderen Cloud wird weiterhin berechnet. Nützlich nur, wenn Speicher und Rechenleistung beim selben Anbieter liegen.
- Ein großzügiges Freikontingent, danach Messung — eine feste Anzahl kostenloser Gigabyte oder Terabyte pro Monat, danach gelten normale Egress-Preise. Gut für kleine Jobs, eine Falle für große Volumen.
- Bandbreitenbegrenzter “kostenloser” Egress — keine Gebühr pro GB, aber die Portgeschwindigkeit wird gedrosselt, sodass große Transfers langsam statt teuer sind. Sie bezahlen mit Echtzeit statt mit Geld.
- Kostenloser Egress, aber separater Storage-Egress — das Abrufen von angehängtem Blockspeicher kann kostenlos sein, während das Abrufen von einem separaten Objektspeicher nicht kostenlos ist. Die Grenze ist, was berechnet wird.
Es gibt einen echten Kompromiss abzuwägen. Ein Anbieter, der kostenlosen Egress bündelt, kann einen etwas höheren stündlichen GPU-Preis haben, weil diese Bandbreitenkosten irgendwo untergebracht werden müssen. Für einen egress-armen Workload — lange Trainingsläufe, die Checkpoints behalten, oder interaktive Notebook-Arbeit — kann ein niedrigerer Stundenpreis mit gemessenem Egress, den Sie nie auslösen, insgesamt günstiger sein. Die richtige Wahl hängt vollständig von Ihrem Output-zu-Compute-Verhältnis ab.
Was Sie prüfen sollten, bevor Sie sich binden
- Ob kostenloser Egress für öffentlichen Internetverkehr gilt oder nur für intra-provider Transfer.
- Ob es eine monatliche Obergrenze für das kostenlose Kontingent gibt und wie hoch der Preis pro GB ist, wenn Sie diese überschreiten.
- Die Port-/Bandbreitenbegrenzung, denn “kostenlos aber langsam” kostet Sie GPU-Stunden, während die Daten übertragen werden.
- Ob Storage-Abrufe (Objektspeicher-Lesezugriffe, Snapshot-Exporte) separat vom Netzwerk-Egress als Egress gezählt werden.
- Wie die Richtlinie mit Spot- oder unterbrechbaren Instanzen interagiert — Sie müssen Daten möglicherweise schnell evakuieren, wenn ein Knoten zurückgenommen wird, und gemessener Egress unter Zeitdruck ist schmerzhaft.
Das Lesen des obigen Vergleichs für Egress
Schätzen Sie Ihren Egress, bevor Sie die Tabelle lesen: ungefähr wie viele Gigabyte pro Lauf die Plattform verlassen, multipliziert mit der Anzahl der Läufe pro Monat. Kombinieren Sie das mit dem oben gezeigten stündlichen GPU-Preis. Ein Host mit null Egress und einem geringfügig höheren Stundenpreis gewinnt oft bei Produktionsbetrieb, Batch-Inferenz und Rendering, wo das Output-Volumen hoch und vorhersehbar ist. Für trainingsintensive, output-leichte Arbeit wägen Sie zuerst den niedrigeren Stundenpreis ab und betrachten Egress als sekundären Faktor. Da sich sowohl Bandbreitenrichtlinien als auch Preise ändern, verwenden Sie den obigen Live-Vergleich für die aktuellen Stundenpreise und bestätigen Sie die Egress-Bedingungen jedes Anbieters anhand der hier aufgeführten Punkte.
Häufig gestellte Fragen
Bedeutet “zero egress”, dass mein gesamter Datentransfer kostenlos ist?
Nicht immer. Es bedeutet zuverlässig, dass ausgehender Datenverkehr keine Gebühr pro Gigabyte verursacht, aber einige Anbieter beschränken das auf Verkehr, der innerhalb ihres eigenen Netzwerks bleibt, oder schließen nur ein festes monatliches Kontingent ein, bevor die Messung beginnt. Eingehender Transfer (Ingress) ist fast überall kostenlos, daher ist die Egress-Aussage der Teil, der überprüft werden sollte.
Wie stark können Egress-Gebühren realistisch die GPU-Rechnung erhöhen?
Das hängt vollständig vom Output-Volumen ab. Einige experimentelle Notebooks erzeugen vernachlässigbaren Egress, sodass die Gebühr eine Rundungsdifferenz ist. Eine Produktionspipeline, die große Checkpoints exportiert, Videos rendert oder Modellantworten an Nutzer liefert, kann Terabytes pro Monat bewegen, wobei gemessener Egress einen erheblichen Anteil der Gesamtkosten ausmachen kann — manchmal nahe an den Compute-Kosten selbst.
Sollte ich immer einen Zero-Egress-Anbieter wählen?
Nein. Kostenloser Egress geht manchmal mit einem etwas höheren stündlichen GPU-Preis einher. Wenn Ihr Workload Daten an Ort und Stelle hält — lange Trainingsläufe, interaktive Entwicklung — zahlen Sie möglicherweise insgesamt weniger mit einem günstigeren Stundenpreis und gemessenem Egress, den Sie selten auslösen. Passen Sie die Richtlinie an Ihr Output-zu-Compute-Verhältnis an, statt Zero Egress automatisch als besser zu betrachten.
Wird kostenloser Egress jemals gedrosselt?
Ja. Einige Anbieter bieten keine Gebühr pro Gigabyte, drosseln aber die Portgeschwindigkeit, sodass ein großer Export langsam statt teuer ist. Da die GPU-Uhr möglicherweise weiterläuft, während die Daten übertragen werden, hat “kostenlos aber langsam” dennoch reale Kosten in GPU-Stunden. Prüfen Sie immer die Bandbreitenbegrenzung zusammen mit der Preisgestaltung.