Cloud-GPU-Anbieter ohne Ausgabekosten
Ausgabekosten — Gebühren für die Datenübertragung aus der Cloud — können beim Exportieren von Modellgewichten, Bereitstellen von Inferenz-Ergebnissen oder Verschieben von Datensätzen zwischen Anbietern erhebliche unerwartete Kosten verursachen. Anbieter ohne Ausgabekosten bieten vorhersehbare Preise und erleichtern die Nutzung von Multi-Cloud-Strategien. Dieser Leitfaden stellt GPU-Cloud-Anbieter vor, die keine Gebühren für ausgehende Datenübertragungen erheben.
Für diese Anleitung wurden noch keine passenden GPU-Anbieter gefunden. Schauen Sie bald wieder vorbei.
Was “zero egress fees” tatsächlich bedeutet, wenn Sie Cloud-GPUs mieten
Egress sind die Daten, die das Netzwerk eines Anbieters verlassen — die Bytes, die Sie aus der Cloud auf Ihren Laptop, in eine andere Cloud oder zu Endnutzern herunterladen. Viele Infrastrukturplattformen messen diesen Datenverkehr und berechnen pro Gigabyte, während sie für Ingress (eingehende Daten) wenig oder gar nichts berechnen. Ein “zero egress” oder “$0 egress” GPU-Host verspricht, dass das Herausziehen Ihrer Daten keine Kosten verursacht, die über die bereits gemietete Rechenleistung hinausgehen. Auf einer GPU-Plattform ist dies eine bedeutende Unterscheidung, da KI- und Rendering-Workloads ungewöhnlich datenintensiv auf dem Ausgang sind: Modell-Checkpoints, exportierte Gewichte, gerenderte Frames, Batch-Inferenz-Ergebnisse und synthetische Datensätze müssen alle irgendwohin übertragen werden, sobald die GPU fertig ist.
Der Grund, warum Egress überhaupt separat berechnet wird, liegt darin, dass die Bandbreite zum öffentlichen Internet für Anbieter eine echte Upstream-Kostenquelle darstellt. Plattformen, die keine Egress-Gebühren werben, absorbieren diese Kosten entweder in den stündlichen GPU-Preis, operieren in einem Netzwerk, in dem der Transit günstig ist, oder beschränken den inbegriffenen kostenlosen Transfer auf den Datenverkehr, der innerhalb ihres eigenen Backbones bleibt. Herauszufinden, welche dieser Bedingungen auf jeden Eintrag im obigen Vergleich zutrifft, ist das ganze Spiel.
Warum Egress für echte GPU-Workflows wichtig ist
Der Stundenpreis einer GPU ist nur eine Position auf der Rechnung. Bei datenintensiven Jobs kann der Transfer stillschweigend zu einer zweiten Rechnung werden — und im Gegensatz zur Rechenleistung ist er schwer vorherzusagen. Egress-Gebühren schlagen besonders bei diesen Mustern zu:
- Training, das große Checkpoints exportiert — Modelle mit mehreren Milliarden Parametern erzeugen Checkpoints, die in Dutzenden oder Hunderten von Gigabyte gemessen werden. Wenn Sie häufig Snapshots machen und jeden davon außerhalb der Plattform kopieren, kann der gemessene Egress die GPU-Kosten rivalisieren.
- Batch-Inferenz mit hoher Durchsatzrate — das Erzeugen von Embeddings, Bildunterschriften oder transformierten Medien für Millionen von Elementen bedeutet, dass das Output-Volumen das Input-Volumen übersteigen kann. Dieses Output ist Egress, sobald es den Anbieter verlässt.
- Rendering und Video — fertige Frames und kodierte Videos sind groß und werden fast immer zurück in Speicher oder zur Auslieferung gezogen, was Rendering zu einem der egress-sensibelsten GPU-Workloads macht.
- Multi-Cloud- und Hybrid-Pipelines — das Verschieben eines Datensatzes oder Modells zwischen einem GPU-Host und einem separaten Objektspeicher, Vektordatenbank oder Servicestufe überschreitet bei jedem Vorgang eine Netzwerkschranke, und jede Überschreitung kann gemessen werden.
- Modelle für echte Nutzer bereitstellen — wenn die GPU-Box selbst API-Anfragen beantwortet, ist jeder Antwort-Token oder jedes Bild, das an einen Client gestreamt wird, Egress.
Zero Egress entfernt den Teil der Rechnung, der mit der tatsächlichen Nutzung der Ergebnisse Ihrer Rechenleistung skaliert. Für Experimente ist das kaum spürbar; für Produktionspipelines, die Gigabytes pro Stunde versenden, kann es den Unterschied zwischen zwei Anbietern ausmachen, deren stündliche GPU-Preise identisch erschienen.
Das Kleingedruckte hinter “kein Egress”
Nicht jede Behauptung über “kostenlosen Egress” deckt dasselbe ab, und die Fußnoten sind der Punkt, an dem Käufer überrascht werden. Beim Vergleich der obigen Einträge prüfen Sie genau, was ein Anbieter meint:
- Wirklich ungemessener öffentlicher Egress — jeder Download ins offene Internet ist kostenlos, ohne jegliche Gebühr pro GB. Dies ist die stärkste Form und die nützlichste für den Produktionseinsatz.
- Nur kostenloser interner Egress — der Transfer ist kostenlos, solange er innerhalb der eigenen Region oder des Backbones des Anbieters bleibt, aber das Verlassen ins öffentliche Internet oder in eine andere Cloud wird weiterhin berechnet. Nur nützlich, wenn Speicher und Rechenleistung beim selben Anbieter liegen.
- Ein großzügiges Freikontingent, danach gemessen — eine feste Anzahl kostenloser Gigabyte oder Terabyte pro Monat, danach gelten die normalen Egress-Tarife. Gut für kleine Jobs, eine Falle für große Volumen.
- Bandbreitenbegrenzter “kostenloser” Egress — keine Gebühr pro GB, aber die Portgeschwindigkeit wird gedrosselt, sodass große Transfers langsam statt teuer sind. Sie zahlen in Echtzeit, nicht in Geld.
- Kostenloser Egress, aber separater Speicher-Egress — das Abrufen von angehängtem Blockspeicher kann kostenlos sein, während das Abrufen aus einem separaten Objektspeicher nicht kostenlos ist. Die Grenze ist das, was berechnet wird.
Es gibt einen echten Kompromiss abzuwägen. Ein Anbieter, der kostenlosen Egress bündelt, kann einen etwas höheren stündlichen GPU-Preis haben, weil diese Bandbreitenkosten irgendwo getragen werden müssen. Für einen egress-armen Workload — lange Trainingsläufe, die Checkpoints behalten, oder interaktive Notebook-Arbeit — kann ein niedrigerer Stundenpreis mit gemessenem Egress, den Sie nie auslösen, insgesamt günstiger sein. Die richtige Wahl hängt vollständig von Ihrem Output-zu-Compute-Verhältnis ab.
Was Sie vor der Verpflichtung prüfen sollten
- Ob kostenloser Egress für öffentlichen Internetverkehr oder nur für intra-anbieterlichen Transfer gilt.
- Jegliche monatliche Obergrenze für das kostenlose Kontingent und den GB-Preis, sobald Sie diese überschreiten.
- Die Port-/Bandbreitenbegrenzung, da “kostenlos aber langsam” Sie GPU-Stunden kostet, während die Daten übertragen werden.
- Ob Speicherabrufe (Objektspeicher-Lesezugriffe, Snapshot-Exporte) separat vom Netzwerk-Egress als Egress gezählt werden.
- Wie die Richtlinie mit Spot- oder unterbrechbaren Instanzen interagiert — Sie müssen möglicherweise Daten schnell evakuieren, wenn ein Knoten zurückgenommen wird, und gemessener Egress unter Zeitdruck ist schmerzhaft.
Den obigen Vergleich für Egress lesen
Schätzen Sie Ihren Egress, bevor Sie die Tabelle lesen: ungefähr wie viele Gigabyte pro Lauf die Plattform verlassen, multipliziert mit der Anzahl der Läufe pro Monat. Kombinieren Sie das mit dem oben angegebenen stündlichen GPU-Preis. Ein Host mit null Egress und einem geringfügig höheren Stundenpreis gewinnt oft bei Produktionseinsatz, Batch-Inferenz und Rendering, wo das Output-Volumen hoch und vorhersehbar ist. Für trainingsintensive, output-leichte Arbeit wägen Sie zuerst den niedrigeren Stundenpreis ab und behandeln Egress als sekundären Faktor. Da sich sowohl Bandbreitenrichtlinien als auch Preise ändern, verwenden Sie den obigen Live-Vergleich für die aktuellen Stundenpreise und bestätigen Sie die Egress-Bedingungen jedes Anbieters anhand der hier aufgeführten Punkte.
Häufig gestellte Fragen
Bedeutet “zero egress”, dass mein gesamter Datentransfer kostenlos ist?
Nicht immer. Es bedeutet zuverlässig, dass ausgehender Datenverkehr keine Gebühr pro Gigabyte verursacht, aber einige Anbieter beschränken das auf Datenverkehr, der innerhalb ihres eigenen Netzwerks bleibt, oder schließen nur ein festes monatliches Kontingent ein, bevor die Messung beginnt. Eingehender Datenverkehr (Ingress) ist fast überall kostenlos, daher ist die Egress-Aussage der Teil, der überprüft werden sollte.
Wie stark können Egress-Gebühren realistisch die GPU-Rechnung erhöhen?
Das hängt vollständig vom Output-Volumen ab. Einige experimentelle Notebooks erzeugen vernachlässigbaren Egress, sodass die Gebühr kaum ins Gewicht fällt. Eine Produktionspipeline, die große Checkpoints exportiert, Videos rendert oder Modellantworten an Nutzer liefert, kann Terabytes pro Monat bewegen, wobei gemessener Egress einen erheblichen Anteil der Gesamtkosten ausmachen kann — manchmal fast so viel wie die Compute-Kosten selbst.
Sollte ich immer einen Anbieter mit zero egress wählen?
Nein. Kostenloser Egress geht manchmal mit einem etwas höheren stündlichen GPU-Preis einher. Wenn Ihr Workload Daten an Ort und Stelle hält — lange Trainingsläufe, interaktive Entwicklung — zahlen Sie möglicherweise insgesamt weniger mit einem günstigeren Stundenpreis und gemessenem Egress, den Sie selten auslösen. Passen Sie die Richtlinie an Ihr Output-zu-Compute-Verhältnis an, statt zero egress automatisch als besser zu betrachten.
Wird kostenloser Egress jemals gedrosselt?
Ja. Einige Anbieter bieten keine Gebühr pro Gigabyte, drosseln aber die Portgeschwindigkeit, sodass ein großer Export langsam statt teuer ist. Da die GPU-Uhr weiterlaufen kann, während die Daten übertragen werden, hat “kostenlos aber langsam” dennoch reale Kosten in GPU-Stunden. Prüfen Sie immer die Bandbreitenbegrenzung zusammen mit der Preisgestaltung.