
מדוע OpenAI, Google ו-SpaceX מפתחות שבבים משלהן
Nvidia שלטה בשוק שבבי ה-AI במשך שנים, אך גל חדש של חברות טכנולוגיה מחליט לפתח מעבדים מותאמים אישית כדי לצמצם תלות בספק יחיד. OpenAI חשפה את שבב ה-Jalapeño, המיוצר בשיתוף Broadcom, ומצטרפת ל-Google, Apple ו-SpaceX במגמה שעשויה לשנות את מפת שוק המוליכים למחצה.
המרוץ לשבב העצמאי: כולם רוצים לצאת מהתלות ב-Nvidia
בשנים האחרונות הפכה Nvidia לעמוד השדרה של תשתית ה-AI העולמית. ה-GPU שלה, בראשם סדרות ה-H100 וה-H200, היו כמעט הבחירה הבלעדית לאימון ולהרצת מודלים בקנה מידה גדול. אך בשבועות האחרונים מתגבשת מגמה ברורה: חברות הטכנולוגיה הגדולות ביותר בעולם מחליטות לפתח שבבים משלהן - לא בהכרח כדי להחליף את Nvidia, אלא כדי לא להיות תלויות בה לחלוטין.
רוצה להישאר מעודכן ב-AI?
הירשם לדיוור השבועי שלנו וקבל עדכונים, המלצות על כלים, חדשות ודוחות מיוחדים
חלפיניו Jalapeño: השבב הראשון של OpenAI
OpenAI חשפה לאחרונה את Jalapeño, שבב ה-inference המותאם אישית הראשון שלה, המפותח בשיתוף עם Broadcom. מדובר בצעד משמעותי עבור החברה, שהוציאה עד כה סכומי עתק על חומרת Nvidia לצורך הפעלת מודלים כמו ChatGPT ו-GPT-4. הרעיון מאחורי שבב ייעודי ל-inference הוא פשוט: במקום להשתמש ב-GPU כללי שתוכנן לטפל במגוון עצום של משימות חישוביות, שבב מותאם מבצע בדיוק את הפעולות הנדרשות להרצת מודל שפה - בפחות אנרגיה, בעלות נמוכה יותר, ובמהירות גבוהה יותר.
המקרה של Apple מדגים את הפוטנציאל בצורה ברורה: המעבר משבבי Intel לשבבי Apple Silicon הניב שיפור דרמטי בביצועים ובחיי סוללה. OpenAI שואפת להשיג אפקט דומה בתחום ה-inference.
גוגל, SpaceX ו-Apple - כבר שם
OpenAI אינה פועלת בחלל ריק. Google כבר הפעילה דורות מרובים של מעבדי TPU, שמאפשרים לה לאמן ולהריץ מודלים בעלות נמוכה מזו שהייתה מחויבת לשלם לצד שלישי. Apple משלבת מנועי AI ייעודיים בכל מכשירי ה-iPhone ו-Mac. SpaceX, שנכנסה לתחום ה-AI בצורה פעילה יותר בשנה האחרונה, אף היא מפתחת חומרה מותאמת לצרכיה הספציפיים.
המכנה המשותף לכולם: הפחתת סיכון ספק יחיד. כאשר כל תשתית ה-AI שלך תלויה ביכולת לרכוש GPU אחד ממקור יחיד - בין אם בגלל מגבלות ייצור, מחיר, או לחצים גיאופוליטיים - הפגיעות העסקית גבוהה מאוד.
לא מחליפים את Nvidia - מגדרים מולה
חשוב להבין: אף אחת מהחברות הללו לא מתכוונת לנטוש את Nvidia לחלוטין בטווח הנראה לעין. אימון מודלים בקנה מידה גדול עדיין דורש את הביצועים שרק ה-GPU של Nvidia מסוגל לספק. מה שמשתנה הוא שלב ה-inference - הרצה בפועל של המודלים מול משתמשי קצה - שם שבבים מותאמים יכולים להשיג יתרון עלות ניכר.
האסטרטגיה היא גידור, לא נטישה. שבבים מותאמים לשלב ה-inference מאפשרים חיסכון משמעותי בעלויות תפעול, מבלי לוותר על Nvidia לשלב האימון.
ההשלכות על שוק המוליכים למחצה הישראלי
עבור חברות ישראליות בתחום ה-AI וחומרת המחשוב, המגמה הזו יוצרת הזדמנות ואתגר כאחד. חברות כמו Tower Semiconductor, המתמחה בייצור שבבים מותאמים אישית, עשויות להיות מוטבות ישירות מהביקוש הגובר ל-custom silicon. מנגד, סטארטאפים ישראליים שבנו את מוצריהם סביב ארכיטקטורת Nvidia בלעדית נדרשים לבחון האם כדאי להם לפתח גמישות ארכיטקטורלית גם לחומרה חלופית.
התחרות על שוק שבבי ה-AI רחוקה מסיום. אך ברור שעידן שליטתה המוחלטת של Nvidia נמצא בנקודת מפנה. (כפי שפורסם ב-TechCrunch)
