fbpx

משמונה שעות ל-80 שניות: Nvidia קובעת שמונה שיאים חדשים בתחום הבינה המלאכותית

אתה לא יכול להיות ראשון אם אתה לא מספיק מהיר. חברת Nvidia המפתחת פלטפורמות חומרה ותוכנה בעבור פיתוח והאצה של יישומי בינה מלאכותית קבעה שמונה שיאים חדשים בתחום, במבחני הביצועים MLPerf.

בחברות המובילות בעולם, צוותי מחקר ומדעני נתונים יוצרים רשתות בינה מלאכותית גדולות יותר ומורכבות יותר מיום ליום. רשתות בינה מלאכותית מתקדמות מצריכות יכולת אימון מהירות ומתקדמות יותר, ברמת החומרה וברמת התוכנה. על מנת להוביל את תחום הבינה המלאכותית נדרשות מגוון יכולות מן התשתית עליה מתבססים החוקרים ומבחני ביצועים כדוגמת MLPerf מספקים את התמונה המעידה על יכולות העיבוד של המערכות השונות הקיימות בשוק.

nvidia mlpref benchmarks records
תוצאות מבחני הביצועים. מתוך האתר של Nvidia

מבחני הביצועים של MLPerf כוללים אימון של מגוון סוגי רשתות בינה מלאכותית הנועדו למשימות שונות. בנוסף, מבחני ביצועים אלו נחשבים לנקודת ייחוס ומידע מהימן וחשוב על ידי מספר גופים גדולים בתעשייה כדוגמת Nvidia, Google, Intel, Baidu וכן גם מספר אוניברסיטאות מובילות ושורה ארוכה של חברות טכנולוגיה.

חברת Nvidia, קובעת כעת לא פחות משמונה שיאים חדשים ב-MLPerf שלושה שיאים ב-overall performance at scale וחמישה שיאים חדשים ב-per-accelerator basis. קביעת שמונה שיאים חדשים ברצף הוא שיא בפני עצמו ועוד יותר מרשים כאשר מדובר בחברה בודדת.

משמונה שעות ל-80 שניות

ב-2015 להכשיר את מודל זיהוי התמונה ResNet-50 באמצעות K80 CUDA NVIDIA נמשך 25 יום, ונכון לאותה התקופה זה נחשב זמן שיא אך יחד עם זאת הטכנולוגיה התפתחה והאופטימיזציה השתפרה. שלוש שנים קדימה, שנת 2017, חברת Nvidia השיקה את מערכת ה-DGX הכללה מספר יחידות עיבוד Volta V100 אשר הצליחה לצמצם את זמן הלמידה של המודל ליום עבודה אחד, לשמונה שעות בלבד. מדובר היה בפריצת דרך של ממש, להגיע בתוך שלוש שנים לצמצום באחוזים כה גדולים זו משימה לא פשוטה בכלל.

כיום, בראש ליין המוצרים של Nvidia עומדת מערכת ה-NVIDIA DGX SuperPOD – המשתמשת באותם מעבדים גראפיים מסוג V100, אשר עכשיו מקושרים ביניהם באמצעות טכנולוגיית ה-  InfiniBand של חברת Mellanox, אותה חברת Nvidia רוכשת בימים אלו ממש. יחד עם שימוש בטכנולוגיה פורצת הדרך של Mellanox ושיפורי אופטימיזציה, הצליחה Nvidia לצמצם את זמני האימון של ResNet-50 ל-80 שניות בלבד, מה שיקצר בצורה משמעותית את זמני המנוחה ושתיית הקפה של המפתחים.

אתה לא יכול להיות ראשון אם אתה לא מספיק מהיר

זמני האימון הם אחד האתגרים הבעייתיים ביותר בכל הנוגע ליצירת בינה מלאכותית. גם מפתחים בתחילת דרכם מוצאים את המערכות הקיימות אצלהם מגיעות לניצול של 100% מן המשאבים הזמינים ועדיין זמני האימון והלמידה עשויים להיות ארוכים מאוד, כאשר עד לסופו של התהליך, לא ניתן לדעת האם מדובר בהצלחה או בכישלון.

זמני פיתוח ארוכים מידי עשויים לגרום לעיכובים במחקרים ופרוייקטים אשר מתגלגלים להפסדים כלכליים, חוסר רלוונטיות בשוק ובמקרים מסויים חברות מתחרות עשויות להשתמש בחומרה מתקדמת יותר ולסיים את הפיתוח בצורה יעילה ומהירה יותר.

השוואת הביצועים שערך טוני מלינקוביץ'.

בימים אלו גם אני עובד על מספר פרוייקטים בתחום הבינה המלאכותית כאשר על אחד מהם זמן העבודה המוקצב לי הוא נמוך יחסית ולכן אחת המטרות שלי הייתה לנצל בצורה המיטבית ביותר את המערכת והמשאבים העומדים לרשותי. לשם כך, הרצתי משימת אימון אחת בלבד, פעם אחת על המעבד שלי ובפעם השנייה על כרטיס המסך שלי (Nvidia GTX 1070 8GB).

התוצאות היו פשוט מדהימות והחלק המדהים הוא שהן רק הולכות להשתפר יחד עם שיפור ספריות הבינה המלאכותית ושיפורי האופטימיזציה שעושה Nvidia במשך השנה. נכון, אני עדיין מוגבל ברמת התקשורת וכמות המידע המועבר על גבי הרשת ובין הכוננים אך עדיין ההבדלים היו מרשימים.

אם נחזור לתעשייה, ניתן לראות שבעזרת שימוש בספריות שעברו אופטימיזציה לצד חומרה מתקדמת ופתרונות הקישוריות המתקדמים של ענקית התקשורת Mellanox ניתן להאיץ מגוון רחב מאוד של פיתוחים בעשרות של אחוזים מבלי לגרום למאמץ רב בקרב צוותי ה-IT השונים בארגונים.

מבחני הביצועים העדכניים של MLPerf מציגים לנו בבירור מהם הפתרונות המהירים והיעילים ביותר בעבור פיתוח כל סוגי הבינה המלאכותית, בין אם הם עוסקות בניתוח ווידאו, תמונה, טקסט, סאונד או כל דבר אחר.

טוני מלינקוביץ'
טוני הוא העורך הראשי שלנו כאן באתר, עם ידע רחב בחומרה ומקורות מהירים, טוני הוא גם הכתב המהיר ביותר שלנו, בנוסף לכתבות המעולות של טוני הוא גם אחראי על רוב הביקורות שלנו באתר וגם על המלל וחוות הדעת על חלק מסיקורי הוידאו שלנו.
דילוג לתוכן