חברת NVIDIA חושפת את ארכיטקטורת Ampere ומציגה שיפור ביצועים משמעותי

במשך השנים האחרונות הובילה NVIDIA את תחום הבינה המלאכותית והציעה פלטפורמות עתירות ביצועים למגוון רחב של יישומים ושימושים כאשר בלב כולן עומדות CUDA וארכיטקטורת VOLTA שהושקה לפני שלוש שנים. העולם עבר המון שינויים בשלוש השנים האלו. כשהושקה VOLTA תחום ה-Deep Learning היה בשלבים מוקדמים, ומאז הדרישות לכוח מחשוב השתנו וגדלו בצורה משמעותית. 

במקביל, כמידי שנה תכננה NVIDIA לקיים גם השנה (2020) את כנס ה-GTC המפורסם שלה אך לנגיף הקורונה היו תוכניות קצת אחרות. במקום, קיימה החברה שורה ארוכה של הרצאות, מדריכים ו-Webinars בנושאים רבים הקשורים לבינה מלאכותית, Machine Learning ו-Deep Learning. השיא של GTC 2020 מגיע היום (15.05.2020), עם הרצאתו של ג'נסן הואנג, מנכ"ל ומייסד חברת NVIDIA. בהרצאתו חשף ג'נסן הואנג שורה של פיתוחים שייקחו את תחום המחשב צעד אחד קדימה, או יותר נכון, 20 צעדים קדימה.

הכירו את Ampere

אחרי ציפייה ארוכה במיוחד, לא מעט שמועות והשערות חושפת NVIDIA את ארכיטקטורת Ampere המציעה שיפור של עד פי 20 ביחס ל-VOLTA. ארכיטקטורת Ampere היא המחליפה הישירה של VOLTA ובהמשך ייתכן מאוד והיא תחליף גם את Turing הנמצאת בשימוש בקרב גיימרים, משתמשים ביתיים ויוצרי תוכן. Ampere מציעה מגוון רחב של שיפורים ברמת החומרה והיא מיוצרת בליתוגרפיית 7nm של TSMC תוך שימוש בטכנולוגיית 3D Stacking. אחד ההישגים המרשימים ביותר של NVIDIA הוא בגודל השבב של Ampere A100 אשר עומד על 826mm2 וכולל בתוכו לא פחות מ-54 מיליארד טרנזיסטורים. מדובר בגודל המתקרב מאוד למגבלה הפיזית האפשרית של שבבי סיליקון וזהו למעשה השבב הגדול בעולם.

ארכיטקטורת Ampere ו-Ampere A100 בפרט נוצרו במיוחד עבור הצרכים המודרניים והחדשים של עולם המחשוב. בימינו, הצורך בכוח מחשוב מתקדם הוא גדול ומתמיד והודות לארכיטקטורת Ampere מצליחה NVIDIA להציע קפיצה משמעותית במיוחד של עד פי 20 ביחס ל-VOLTA. בנוסף לכך, הגדלת הזיכרון המובנה ב-GPU ל-40GB יחד עם הגדלה משמעותית של רוחב הפס שלו ל-1.6TB/s מאפשרים לו להתמודד עם הרבה יותר מידע במקביל.

nvidia ampere A100 info
ה-NVIDIA Ampere A100. קרדיט: NVIDIA

גמישות ואלסטיות

GPU בודד זה נחמד אבל לא מספיק. ה-Data Center המודרני צריך להיות עתיר ביצועים. בימינו, באחוז עצום מחוות השרתים בעולם קיים מערך עצום של מאות ואפילו אלפים של כרטיסי מסך כאשר ישנה חשיבות רבה לגמישות של השרתים. הרבה פעמים חברות וגם ספקיות שירותי ענן כמו AWS, Google ו-Microsoft נדרשות לבצע הרחבות וצמצומים של חוות השרתים ויחד עם זאת גם לבצע הקצאת משאבים חכמה ויעילה בין הלקוחות או צוותי הפיתוח השונים.

ארכיטקטורת Ampere תוכננה בדיוק עם המחשב הזו בראש והיא למעשה מאפשרת לחלק כל יחידת A100 עד לשבעה חלקים שונים בהתאם למשימות השונות. הודות לשיפור הביצועים של Ampere, כל יחידה כזו יכולה להיות עוצמתית במיוחד. יחד עם זאת, הודות לדור השלישי של טכנולוגיית NVIDIA NVLink®, ניתן לאחד כמה יחידות A100 ל-GPU אחד ענקי כאשר כל אחת מיחידות ה-GPU הפיזיות מסוגלת לגשת לזיכרון של השנייה בצורה מהירה ויעילה. טכנולוגיית ה-NVSwitch לוקחת גם היא תפקיד חשוב ושומרת על תקשורת יעילה ותקינה בין כלל כרטיסי המסך.

לדברי ג'נסן הואנג, הוא רואה את חוות השרתים העתידית כיחידת מחשוב אחת גדולה וגמישה, כזו שניתן לעשות לה Scale, להרחיב ולהקטין בקלות רבה. ההשקה של Ampere מהווה צעד משמעותי בדרך לשם. החשיבות של הגמישות היא גדולה מאחר והיא תאפשר לחלק את יחידת המחשוב הבודדת באופן חכם וקל. בין אם מדובר בהקצאה של חלק מן המערכת לצרכי אימון בינה מלאכותית ואת החלק האחר לצרכי הסקה (Inference), בין אם מדובר בחלוקת המשאבים בין כלל צוותי המחקר והפיתוח (R&D) ועוד.

NVIDIA DGX A100
ה-NVIDIA DGX A100. קרדיט: NVIDIA

השרת העוצמתי בעולם – DGX A100

לצד ארכיטקטורת Ampere, השיקה NVIDIA את DGX A100 שאת חלקו אפה ג'נסן הואנג בתנור הביתי שלו ערב לפני ההשקה. ה-DGX A100 הוא שרת עוצמתי במיוחד הכולל עד ל-8 כרטיסי מסך מדגם Ampere A100 כאשר הם מחוברים כולם יחד הודות ל-NVSwitch ו-NVLink. כאשר הם מחוברים כולם יחדיו, הם הופכים לכרטיס המסך הגדול ביותר בעולם הכולל בתוכו 320GB של זיכרון Vram. בנוסף, ה-DGX A100 מסוגל להתפצל עד ל-56 יחידות עיבוד עוצמתיות וחזקות במיוחד לצרכי Inference למשל.

על מנת להתמודד עם כמויות עצומות של מידע המגיע במקביל לשרת בכל רגע נתון, ה-DGX A100 כולל שמונה כרטיסי רשת מסוג ConnectX-6 HDR 200GB/s של חברת Mellanox. מדובר בכמויות אדירות של מידע המתורגמות למאות אלפי בקשות אשר יכולות להגיע לשרת בכל רגע נתון. הצעד הזה ממחיש בצורה מיטבית את החשיבות של המיזוג בין NVIDIA ל-Mellanox והחשיבות של שיתוף הפעולה שבין השתיים.

"NVIDIA DGX A100 היא המערכת האולטימטיבית לקידום הבינה המלאכותית," אמר ג'נסן הואנג, מייסד ומנכ"ל אנבידיה. "NVIDIA DGX היא מערכת ה-AI הראשונה שנבנתה לרצף השלם של למידת מכונה, מהנתונים דרך האנליטיקה והטריינינג ועד להיקשים. והודות לזינוק העצום בביצועים שמציע ה-DGX החדש, מהנדסי למידת מכונה יכולים להשתלט על ההיקפים העצומים והגדלים של נתוני ומודלי AI."

NVIDIA לא שוכחת לרגע את מגיפת הקורונה (COVID-19) והיא שלחה כבר כמה שרתי DGX A100 למשרד האנרגיה של ארצות הברית (DOE) וגם ל-Argonne National Laboratory במטרה להאיץ פי כמה את המחקר והמלחמה במגיפה הקשה הזו. בעבור שאר המשתמשים, המערכת זמינה כבר עכשיו כאשר העלות שלה עומדת על 199,000 דולרים המתורגמים לכ-702,931 ש"ח נכון לרגע כתיבת הכתבה. חשוב לציין כי בשלב זה, ה-Ampere A100 לא יגיע כיחידה בפני עצמו אלא רק דרך שרתים כמו ה-DGX A100. זאת לאור האימוץ המתון והאיטי של ה-Volta V100 שנמכר כיחידה עצמאית.

אימוץ מהיר בענן

מגיפת הקורונה עוררה עליה עצומה בשימוש ברשת האינטרנט ובענן. ספקיות שירותי הענן וחברות רבות נדרשות כמעט בין-רגע לשדרג באופן משמעותי את תשתיות המחשוב שלהן וכתוצאה מכך, NVIDIA צופה אימוץ מהיר יחסית של ה-DGX A100 בקרב ספקיות שירותי הענן הגדולות כאשר רבות מהן כדוגמת Google Cloud, Amazon AWS, Microsoft Azure, Oracle כבר הודיעו כי בכוונתן לפרוס את ה-DGX A100 בענן שלהן. בשלב זה לא ידוע לנו מתי בדיוק משתמשי העננים יוכלו להשתמש בטכנולוגיות חדשות אלו.

בנוסף, הביקוש לפתרונות תקשורת גדל בצורה משמעותית מה שמהווה הזדמנות עסקית מעולה ל-NVIDIA שזה עתה השלימה את הרכישה של חברת Mellanox המתמחה ואף מובילה בכל הקשור לציוד תקשורת ברוחב פס גבוה. השילוב שבין המוצרים של NVIDIA לאלו של Mellanox יאפשר להאיץ בעשרות מונים את זמני העיבוד של הבינה המלאכותית ושל יישומים רבים אחרים המתבססים על גבי כרטיסי מסך (GPUs).

טוני מלינקוביץ'
טוני הוא העורך הראשי שלנו כאן באתר, עם ידע רחב בחומרה ומקורות מהירים, טוני הוא גם הכתב המהיר ביותר שלנו, בנוסף לכתבות המעולות של טוני הוא גם אחראי על רוב הביקורות שלנו באתר וגם על המלל וחוות הדעת על חלק מסיקורי הוידאו שלנו.
דילוג לתוכן