חזרה לחדשות
סיור בלעדי במעבדת Trainium של אמזון: כך מאיימת AWS על הדומיננטיות של Nvidia

סיור בלעדי במעבדת Trainium של אמזון: כך מאיימת AWS על הדומיננטיות של Nvidia

23 במרץ 2026
מערכת זירת AI

כתבת TechCrunch ביקרה במעבדה הסודית של AWS באוסטין, שם מפותח שבב Trainium3 שכבר הצליח למשוך את Anthropic, OpenAI ואפילו Apple. עם 1.4 מיליון שבבים פרוסים והבטחה ל-50% הפחתה בעלויות תפעול, אמזון מנסה לשבור את המונופול של Nvidia בתחום שבבי ה-AI. המשמעות: חברות ישראליות שמשתמשות ב-AWS עשויות לקבל גישה זולה יותר לתשתית AI מתקדמת.

מבט ראשון לתוך מפעל השבבים שמאתגר את Nvidia

זמן קצר לאחר שמנכ"ל אמזון אנדי ג'אסי הכריז על השקעה של 50 מיליארד דולר ב-OpenAI, AWS הזמינה את ג'ולי בורט, עורכת TechCrunch, לסיור פרטי במעבדת הפיתוח שעומדת בלב העסקה: מעבדת השבבים באוסטין, טקסס. מומחי התעשייה עוקבים מקרוב אחרי שבב "Trainium" של אמזון אשר פותח במתקן זה, בשל ההשלכות שלו על הוזלת עלויות ה-Inference של AI ועל הסיכוי האמיתי לפגיעה במונופול של Nvidia.

רוצה להישאר מעודכן ב-AI?

הירשם לדיוור השבועי שלנו וקבל עדכונים, המלצות על כלים, חדשות ודוחות מיוחדים

מעבדה שמייצרת יותר משבבים

המעבדה, הממוקמת באזור The Domain המפואר באוסטין, היא לא מפעל ייצור, אלא מוקד הפיתוח שבו מתרחש הרגע הקריטי שבו השבב מופעל לראשונה (bring-up). כריסטופר קינג, מנהל המעבדה, תיאר את התהליך: "זה כמו מסיבת לילה גדולה. אתה נשאר פה, כמו בסגר, ולאחר 18 חודשי עבודה השבב מופעל לראשונה כדי לוודא שהוא עובד כמתוכנן".

וזה באמת לא הולך חלק... במקרה של Trainium3, המימדים של חיבור השבב לגוף הקירור לא התאימו. הצוות לא התבלבל: "מיד הבאנו מטחנה והתחלנו לטחון את המתכת, וכדי לא להפריע למסיבה, התגנבנו לחדר ישיבות וביצענו את העבודה שם" מספר קינג.

המעבדה מכילה גם עמדת ריתוך מיוחדת, שבה מהנדס החומרה אייזק גוואלרה הדגים ריתוך של רכיבים זעירים דרך מיקרוסקופ - עבודה מסובכת כל כך שאפילו מארק קרול, אחד ממנהלי ההנדסה הבכירים בחברה, הודה בגלוי שהוא לא מסוגל לבצע אותה.

Trainium מול Nvidia: תחרות על העלויות

מעבר לכך שהם מהווים חלופה לשבבי GPU של Nvidia שקשה להשיג, אמזון טוענת שהשבבים החדשים הפועלים על שרתי Trn3 UltraServers החדשים עולים עד 50% פחות להפעלה לעומת שרתי ענן קלאסיים עם ביצועים דומים.

יחד עם Trainium3 שהושק בדצמבר 2025, הצוות פיתח גם מתגי נוירון חדשים, שמאפשרים לכל שבב Trainium3 לתקשר עם כל שבב אחר בתצורת Mesh (רשת אחידה), מה שמפחית את זמני ההשהייה. "זה למה Trainium3 שובר כל מיני שיאים", אמר קרול, במיוחד בהתחשב במחיר תמורת כמות הכוח שהוא מספק.

כאשר מדובר בטריליוני טוקנים ביום, שיפורים כאלה יכולים לחסוך הרבה מאוד כסף.

Anthropic כלקוח הדגל

נכון לעכשיו, הנתח הגדול ביותר של שבבי Trainium2 פרוס ב-Project Rainier, אחד ממקבצי המחשוב הגדולים בעולם לתחום ה-AI, שעלה לאוויר בסוף 2025 עם 500,000 שבבים והוא משמש את Anthropic.

בסך הכל, 1.4 מיליון שבבי Trainium פרוסים על פני כל שלושת הדורות, ומודל Claude של Anthropic רץ על למעלה ממיליון משבבי Trainium2 לפי נתוני החברה. חשוב לציין ש-Trainium, שתוכנן במקור לאימון מודלים מהיר וזול יותר, כעת מכוונן ומשמש גם ל-Inference. תהליך ה-Inference: הפעלת מודל AI כדי לייצר תשובות, המהווה כרגע את צוואר הבקבוק הגדול ביותר בתעשייה.

Apple, OpenAI והעסקה הגדולה

בשנת 2024, צוות השבבים של אמזון זכה לשבחים מ-Apple. ברגע נדיר של פתיחות עבור החברה הסודית, מנהל ה-AI של Apple תיאר בפומבי כיצד השתמשו בשבב אחר של הצוות - Graviton, מעבד שרת מבוסס ARM בצריכת חשמל נמוכה, שהיה השבב הראשון שפרץ לשוק שצוות זה עיצב.

עסקת OpenAI הופכת את AWS לספק הבלעדי של כלי בניית הסוכנים החדש של OpenAI, Frontier, שעשוי להפוך לחלק חשוב בעסק של OpenAI אם סוכנים יהפכו ל'שחקנים גדולים' כמו שעמק הסיליקון מנבא. כחלק מהעסקה, AWS הסכימה לספק ל-OpenAI 2 גיגה-וואט של קיבולת חישוב Trainium, התחייבות ענקית בהתחשב בכך ש-Anthropic ושירות Bedrock של אמזון כבר צורכים שבבי Trainium מהר יותר ממה שאמזון מסוגלת לייצר.

עם זאת, ה-Financial Times דיווח השבוע שחברת מיקרוסופט עשויה להאמין שהעסקה של OpenAI עם אמזון מפרה את העסקה שלה עם OpenAI, במיוחד את ההסכם שלפיו מיקרוסופט מקבלת גישה לכל המודלים והטכנולוגיות של OpenAI.

המאמץ לשבור את ה-lock-in של Nvidia

המלכודת המסורתית של שבבים הייתה עלויות המעבר- אפליקציות שנכתבו לשבבי Nvidia חייבות עיצוב מחדש כדי לעבוד עם שבבים אחרים, תהליך הגוזל זמן שמונע ממפתחים לעבור. אבל צוות השבבים של AWS סיפר בגאווה שכעת Trainium תומך ב-PyTorch, מסגרת קוד פתוח פופולרית לבניית מודלי AI. התמיכה כוללת רבים מהמודלים המתארחים ב-Hugging Face, ספרייה ענקית שבה מפתחים משתפים מודלים בקוד פתוח.

המעבר, אמר קרול, דורש "בעצם שינוי של שורה אחת, ואז קומפילציה מחדש, ואז הרצה על Trainium", במילים אחרות, אמזון מנסה לכרסם במונופול של Nvidia בכל מקום אפשרי.

המשמעות עבור חברות ישראליות

עבור חברות ישראליות רבות שמשתמשות בשירותי AWS, פיתוח Trainium עשוי להוות הזדמנות משמעותית. ההפחתה של עד 50% בעלויות תפעול לעומת שרתים מבוססי GPU מסורתיים, בשילוב עם האינטגרציה הקלה של PyTorch, עשויה לאפשר לחברות סטארט-אפ ולחברות גלובליות בישראל, לפתח פתרונות AI מתקדמים בעלויות נמוכות יותר.

עבור חברות שפעילות בתחום כמו צ'אטבוטים, מערכות המלצה או כלי AI המשרתים לקוחות בזמן אמת, המעבר ל-Trainium עשוי להפוך למהלך אסטרטגי. AWS גם הכריזה החודש על שותפות עם Cerebras Systems, בשילוב שבב ה-inference של החברה עם שרתים שמריצים Trainium, עבור ביצועי AI מהירים במיוחד.

צוות הפיתוח מרגיש את הלחץ. מהנדסים יעבדו 24/7 למשך שלושה עד ארבעה שבועות סביב כל אירוע bring-up כדי לתקן בעיות, כך שהשבבים יוכלו להיות מיוצרים המונית ומוכנסים למרכזי נתונים. "זה מאוד חשוב שנגיע כמה שיותר מהר להוכחה שזה באמת יעבוד. עד כה, אנחנו עושים את זה ממש טוב", אמר קרול.

שאלות נפוצות