الأحمال المقيدة بالذاكرة مقابل الأحمال المقيدة بالحوسبة في NVIDIA L40
الإجابة
عنوان أداء NVIDIA L40: 181 تيرافلوبس FP16، 90.5 تيرافلوبس FP32، 864 جيجابايت/ثانية عرض النطاق الترددي، 48 جيجابايت ذاكرة فيديو.
محول إلى مقاييس عملية: تدريب نموذج LLM بسبعة مليارات معامل بدقة FP16 مع أحجام دفعات معقولة عادةً ما يشبع الحوسبة قبل عرض النطاق؛ الخدمة في الوقت الحقيقي على نفس النموذج عادةً ما تكون مقيدة بعرض النطاق وتتبع الرقم 864 جيجابايت/ثانية. تجلس مقاييس توليد الصور بالانتشار بين الاثنين — الخطوات الثقيلة على الحوسبة تستخدم نوى التنسور جيدًا، بينما لا تزال كتل الانتباه تلمس عرض النطاق.
Check the NVIDIA L40 page for complete specifications and related GPU matchups.