NVIDIA H100
80GB HBM3 עם NVLink. הדרך המהירה ביותר לכוונון עדין ולהסקה בתפוקה גבוהה על המודלים הפתוחים הגדולים ביותר.
כל דרגה מגיעה כצומת bare-metal של דייר יחיד — כל ה-GPU שלכם, ללא חלוקת זמן בין משימות זרות.
80GB HBM3 עם NVLink. הדרך המהירה ביותר לכוונון עדין ולהסקה בתפוקה גבוהה על המודלים הפתוחים הגדולים ביותר.
40 או 80GB HBM2e — סוס העבודה המוכח להגשת Qwen, Llama ו-Mistral עם vLLM בעלות צפויה.
48GB GDDR6 — האפשרות החסכונית להסקה יציבה בגודל בינוני ולעומסי יצירה באצווה.
ענני שיתוף מחלקים GPU אחד בין דיירים רבים — ההשהיה שלכם תלויה בזרים. כאן העומס שלכם מקובע לחומרת bare-metal משלכם בתוך גבול שבבעלותכם.
דייר יחיד פירושו שכל הכרטיס — כל ה-VRAM, ליבות ה-SM ונתיבי ה-PCIe — עונה לעומס אחד: שלכם. ללא מתזמן רב-דיירי, ללא פינוי מפתיע וללא אפיק זיכרון משותף.
אלה יכולות תשתית, לא מדדי לקוחות. תפוקה והשהיה תלויות במודל, בגודל האצווה ובקוונטיזציה שלכם — אנו מתאימים את הצומת יחד אתכם לפני כל הצעה.