גרסה חדשה ל-A100, הצצה למחשבי העל של העתיד ועוד – ההכרזות של NVIDIA מכנס מחשוב העל

ענקית הבינה המלאכותית והמעבדים הגראפיים אנבידיה (NVIDIA), יחד עם יצרניות השרתים המובילות בעולם מכריזות על שרתים חדשים ומתקדמים במיוחד שבליבם עומד שבב ה-A100 החדש. השרתים החדשים יגיעו במגוון עיצובים וקונפיגורציות – כאלו שנועדו להתמודד עם האתגרים המורכבים ביותר של הבינה המלאכותית, מדעי הנתונים ומחשוב מדעי.

יותר מ-50 יצרניות מובילות מכל רחבי העולם צפויות להשיק שרתים המונעים על ידי שבב ה-NVIDIA A100. בין היצרניות השונות ניתן למצוא את Asus, Cisco, Dell, Gigabyte, HPE. ועוד. מגוון השרתים החדשים מגיע כחודש לאחר ההשקה של ארכיטקטורת Ampere החדשנית והשקת שבב ה-A100 המבוסס על ארכיטקטורה זו.

"קצב האימוץ של המעבד הגרפי אנבידיה A100 על ידי היצרנים המובילים ושילובו בהיצע החדש שלהם עולה על כל מה שהיכרנו עד היום". "מספרם של שרתי אנבידיה A100 המגיעים משותפינו מבטיח שהלקוחות יוכלו לבחור באפשרויות הטובות ביותר עבור מרכזי הנתונים (דאטה סנטר) שלהם ולהשיג שיעור ניצול גבוה בעלות כוללת נמוכה".

איאן באק, סגן נשיא ומנכ"ל מחשוב מואץ באנבידיה

NVIDIA-A100-PCIe-Launch
ה-NVIDIA A100 PCIe. קרדיט: ServeTheHome

כשבב העיבוד הגרפי (GPU) הראשון המבוסס על ארכיטקטורת NVIDIA Ampere, שבב ה-A100 מסוגל להאיץ יישומים שונים בעד פי 20 בהשוואה לקודמו, ה-V100. הודות לקפיצת הביצועים הזו, נרשם בחברת NVIDIA  הזינוק הגדול ביותר שהשיגה בביצועי GPU עד היום. על מנת להגיע לביצועים כה גבוהים, ה-A100 מציע כמה פריצות דרך טכניות, לרבות טכנולוגיית multi-instance GPU המאפשרת חלוקה למחיצות של-A100 יחיד לשבעה GPUs נפרדים, טכנולוגיית NVIDIA NVLink™ מהדור השלישי המאפשרת לכמה יחידות A100 לפעול יחדיו כיחידה לוגית וכן וגם גם טכנולוגיית structural sparsity החדשה.

הכירו את ה-A100 בגרסת PCIe

אנבידיה חשפה גם גרסת PCIe עבור ה-A100. הוספת גרסת ה-PCIe מאפשרת ליצרניות השרתים לספק ללקוחות מגוון רחב של מוצרים, החל ממערכות בעלות A100 יחיד וכלה בשרתים עם 10 ואף יותר כאלו. מערכות אלו מאיצות מגוון רחב של עומסי עבודה עתירי מחשוב, החל מסימולציות של התנהגות חלקיקים עבור גילוי תרופות חדשות ועד לבניית מודלים פיננסיים טובים יותר לאישורי משכנתאות.

גרסת ה-PCIe תגיע עם TDP העומד על כ-250W לעומת גרסת ה-SXM המגיעה עם TDP של כ-400W. בעוד שנראה כי מדובר בהבדל משמעותי בצריכת החשמל, ככל הנראה ההבדל בביצועים לא אמור להיות גדול מידי ברוב המקרים. את המספרים המדויקים נגלה כאשר שרתים בעלי גרסת ה-PCIe יגיעו אל הענן ואל הלקוחות השונים של NVIDIA.

NVIDIA SELENE
תמונת הדמייה של מחשב העל החדש של NVIDIA. קרדיט: The Tech Street Now

הצצה למחשבי העל של העתיד

בנוסף לגרסה החדשה של ה-A100, חברת NVIDIA נתנה הצצה לדור הבא של מחשבי העל ואף חשפה את SELENE – מחשב העל החדש של החברה אשר הודות לארכיטקטורת Ampere ולתשתיות של Mellanox הוא נבנה בפחות מחודש. עד היום מחשבי על היו מסובכים לבניה. התכנון והבנייה נמשכו חודשים רבים וממשוכים עקב המורכבות הרבה הכרוכה ביצירת תשתית מחשוב גמישה לצד בניית תשתית רשתית שתסוגל להעביר מידע משרת פיזי אחד לאחר בזמן אפסי.

השילוב שבין ארכיטקטורת Ampere, ו-Mellanox שהפכה לחטיבה בתוך NVIDIA אפשר לחברה לבנות את מחשב העל בזמן קצר במיוחד הודות לאינטגרציה הקלה שבין המוצרים של שתי החברות. אם לדבר במספרים, מחשב העל החדש מצויד ב-2,240 מעבדי A100 וב-494 סוויצ'ים (Switches) מדגם Mellanox Quantum 200G InfiniBand. ברמת הביצועים, מחשב העל של NVIDIA מציע למעלה מ-1Exaflops של ביצועי AI וכן 27.6Petaflops ביישומי HPL.

לא די בכך, SELENE הוא לא סתם מחשב על אלא הוא משמש כרפרנס לתעשייה כולה. NVIDIA בחרה לפרסם פרטים טכניים נרחבים אודות SELENE על מנת שגם גורמים אחרים בתעשייה יוכלו לבנות מחשבי על עתירי ביצועים בזמני שיא.

פתרון בינה מלאכותית לניטור יעיל של מחשבי על

NVIDIA השיקה גם את NVIDIA Mellanox UFM Cyber-AI, פלטפורמה המצמצמת השבתות במרכזי נתונים (דאטה סנטרס) המבצעת ניתוח אנליטי של מצב מחשב העל בעזרת בינה מלאכותית. המערכת החדשה מסוגלת  לאתר איומי אבטחה ותקלות תפעולית, וכן כדי לחזות כשלים ברשת. כעת, במקום להחליף רכיב חומרה לאחר שהתקלקל וגרם להשבתה, אנשי ה-IT יוכלו לקבל התראה מראש וכן לבצע את התיקונים הנדרשים מבלי השבתה ארוכה של השרת.

מוצר זה, המצטרף לקו מוצרי UFM המשמש לניהול מערכות InfiniBand כבר יותר מעשור, מיישם בינה מלאכותית כדי ללמוד את "הקצב" התפעולי ודפוסי עומסי העבודה ברשת של מרכז הנתונים. הוא מסתמך על טלמטריה הנאספת בזמן אמת, כמו גם על נתונים היסטוריים ונתוני עומסי עבודה. על סמך קו הבסיס הזה, הפלטפורמה מזהה את בריאות המערכת והשינויים שחלו ברשת ומאתרת ירידות ביצועים ושינויים בשימוש ובפרופיל.

"פלטפורמת UFM Cyber בודקת את 'הסימנים החיוניים' של מרכז הנתונים ומשתמשת בהם לזיהוי ירידה בביצועים, כשלי רכיבים ודפוסי שימוש חריגים. היא מאפשרת למנהלי המערכת לאתר ולהגיב במהירות לאיומי אבטחה ולטפל בכשלים עתידיים, ובכך לחסוך עלויות ולהבטיח שירות עקבי ללקוחות".

גלעד שיינר, סגן נשיא בכיר לשיווק בחטיבת הרישות של מלאנוקס באנבידיה

לא רק חומרה

כידוע, NVIDIA לא מציעה רק פתרונות חומרה אלא גם פתרונות תוכנה מתקדמים. עם ההשקה של ארכיטקטורת Ampere השיקה NVIDIA גרסאות חדשות למגוון פתרונות התוכנה שלה אשר כעת עברו אופטימיזציה לארכיטקטורה החדשה. 11 CUDA וגם גרסאות חדשות של יותר מ-50 ספריות כמו CUDA-X, NVIDIA Jarvis ,NVIDIA Merlin, RAPIDS, ו-NVIDIA HPC SDK עברו אופטימיזציה לייעול הביצועים ולהתאמה מלאה לארכיטקטורת Ampere.

טוני מלינקוביץ'
טוני הוא העורך הראשי שלנו כאן באתר, עם ידע רחב בחומרה ומקורות מהירים, טוני הוא גם הכתב המהיר ביותר שלנו, בנוסף לכתבות המעולות של טוני הוא גם אחראי על רוב הביקורות שלנו באתר וגם על המלל וחוות הדעת על חלק מסיקורי הוידאו שלנו.
דילוג לתוכן