Key specs of NVIDIA A100 SXM (40GB) for transformer workloads

回答

At a glance: NVIDIA A100 SXM (40GB) = Ampere architecture, 40 GB HBM2e memory, 1,555 GB/s bandwidth, 312 FP16 TFLOPS, 19.5 FP32 TFLOPS, 400W, 2020.

Those specs tell most of the story for machine learning: VRAM sets the model ceiling, bandwidth throttles attention-heavy production inference, and TFLOPS set pre-training throughput. NVIDIA A100 SXM (40GB) sits firmly in the class of accelerators targeted at modern transformer workloads — the bandwidth/TFLOPS balance is tuned for large-batch pre-training and production production inference rather than gaming.

Two tracked cloud providers currently offer NVIDIA A100 SXM (40GB): Vast.ai and RunPod. Vast.ai has the cheaper rate at $0.80/hr.

NVIDIA A100 SXM (40GB)に関するさらに多くのFAQ

Vast.ai vs RunPod - GPUプロバイダー比較 (4月 2026)

Vast.aiとRunPodの直接比較。最大資金、利益分配、日次・総合ドローダウン規則、レバレッジ、取引可能資産、支払い頻度、支払い方法、取引許可、KYC制限を購入前に確認。データ更新日 4月 2026。

Vast.ai vs RunPod - GPUプロバイダー比較 (4月 2026)
Vast.ai
即時GPU。透明な価格設定。
Visit Vast.ai
RunPod
AIのために構築されたクラウド — サーバーレス推論から即時のマルチノードクラスタまで、GPUワークロードをオンデマンドで展開・スケール可能。
Visit RunPod
概要
Trustpilot評価 4.4 3.7
本社所在地 United States United States
プロバイダータイプ GPUマーケットプレイス GPU特化型
最適用途 AIトレーニング、推論、ファインチューニング、Stable Diffusion、バッチ処理、研究、LLMサービング、生成AI AIトレーニング、推論、ファインチューニング、Stable Diffusion、バッチ処理、レンダリング、研究、LLMサービング、生成AI
GPUハードウェア
GPUモデル B200、H200、H100 SXM、H100 NVL、A100 SXM、A100 PCIe、RTX 5090、RTX 5080、RTX 5070 Ti、RTX 6000 Pro、RTX 6000 Ada、RTX 4500 Ada、RTX A6000、RTX A5000、RTX A4000、L40S、L40、A40、A10、RTX 4090、RTX 4080、RTX 4070 Ti、RTX 4070、RTX 4060 Ti、RTX 4060、RTX 3090 Ti、RTX 3090、RTX 3080 Ti、RTX 3080、RTX 3070 Ti、RTX 3070、Tesla V100、Tesla T4、A2、GTX 1080 B300、B200、H200、H100 SXM、H100 PCIe、H100 NVL、MI300X、A100 SXM、A100 PCIe、RTX 5090、RTX PRO 6000、L40S、L40、RTX 6000 Ada、RTX 5000 Ada、RTX A6000、RTX A5000、RTX 4090、RTX 4080 SUPER、RTX 4080、RTX 4070 Ti、RTX 3090 Ti、RTX 3090、RTX 3080 Ti、RTX 3080、RTX 3070、A40、A30、A2、L4
最大VRAM(GB) 192 288
インスタンスあたり最大GPU数 8 8
インターコネクト NVLink、InfiniBand NVLink
価格
開始価格($/時) $0.06/hr $0.06/hr
請求単位 秒単位 毎秒
スポット/プリエンプティブル はい はい
予約割引 最大50%割引(1〜6ヶ月予約) 15〜29%(1ヶ月〜1年プラン)
無料クレジット 登録時に少額のテストクレジット付与 最初の10ドル使用後に5〜500ドルのボーナス
転送料金 ホストによって異なる($/TB) なし(無料)
ストレージ ホストによって異なる($/GB/時間、インスタンス存在中に課金) コンテナ/ボリューム(0.10ドル/GB/月)、アイドルボリューム(0.20ドル/GB/月)、ネットワークストレージ(0.07ドル/GB/月 1TB)
インフラストラクチャ
リージョン 500以上の拠点、40以上のデータセンター 31のグローバルリージョン
稼働率SLA 正式なSLAなし(ホストの信頼性スコアは表示可能) 99.99%
開発者体験
フレームワーク PyTorch、TensorFlow、CUDA、vLLM、ComfyUI PyTorch、TensorFlow、JAX、ONNX、CUDA
Docker対応 はい はい
SSHアクセス はい はい
Jupyterノートブック はい はい
API / CLI はい はい
セットアップ時間 即時
Kubernetesサポート いいえ いいえ
ビジネス条件
最低利用期間 なし なし
コンプライアンス SOC 2 タイプ2、HIPAA、GDPR、CCPA SOC 2 タイプII
Vast.ai RunPod

NVIDIA A100 SXM (40GB)を探る