חזרה לחדשות
OpenAI משתפת פעולה עם Cerebras: 750MW חישוב AI אולטרה-מהיר עד 2028

קרדיט תמונה: OpenAI

OpenAI משתפת פעולה עם Cerebras: 750MW חישוב AI אולטרה-מהיר עד 2028

14 בינואר 2026
מערכת זירת AI

OpenAI הודיעה על שותפות אסטרטגית עם Cerebras להוספת 750 מגה-ואט של חישוב AI בעל השהיה נמוכה במיוחד לפלטפורמה. המהלך יוטמע בשלבים וישפר משמעותית תגובות בזמן אמת, עבודה של סוכני AI, יצירת קוד ותוכן חזותי, תוך התאמת התשתית הנכונה לכל עומס עבודה.

OpenAI: שותפות אסטרטגית עם Cerebras תוסיף לפלטפורמה 750 מגה-ואט של חישוב AI אולטרה-מהיר ותאיץ תגובות בזמן אמת. כך עולה מהפרסום של OpenAI אתמול.

עיקרי ההכרזה

  • OpenAI תשלב את מערכות Cerebras בשכבת האינפרנס שלה בשלבים, ותתרחב לעומסי עבודה נוספים לאורך הזמן.
  • הדגש: השהיה נמוכה והזרמת פלט בזמן אמת עבור משימות כמו מענה לשאלות מורכבות, יצירת קוד, יצירת תמונות והרצת סוכני AI חוזרים-מחושבים.
  • קיבולת כוללת של 750MW תעלה לאוויר במספר פעימות עד שנת 2028.

צוטטו בהודעה: סצ'ין קאתי מ-OpenAI אמר כי "אסטרטגיית המחשוב של OpenAI היא לבנות פורטפוליו עמיד המותאם למערכות הנכונות עבור עומסי העבודה הנכונים. Cerebras מוסיפה פתרון אינפרנס ייעודי להשהיה נמוכה...". אנדרו פלדמן, מייסד-שותף ומנכ"ל Cerebras, הוסיף: "כשם שפס רחב שינה את האינטרנט, אינפרנס בזמן אמת ישנה את ה-AI".

למה זה חשוב

ביישומי AI מתקדמים יש לולאת אינטראקציה תכופה: בקשה, חישוב, תשובה. קיצור ההשהיה בלולאה הזו מגדיל שימושיות, שומר משתמשים לזמן ארוך יותר ומאפשר עומסי עבודה עתירי ערך. עבור שיחות קוליות, סיוע תכנותי, משחקים, כלי פרודוקטיביות וסוכנים אוטונומיים, השהיה נמוכה היא קריטית כדי לייצר תחושת "זמן אמת" ונראות רציפה של הטקסט או התמונה הנוצרים.

מה מביאה Cerebras לשולחן

Cerebras בונה מערכות ייעודיות ל-AI המבוססות על שבב ענק יחיד המאחד חישוב, זיכרון ורוחב פס בצמידות גבוהה. גישה זו מפחיתה צווארי בקבוק של רשתות תקשורת בין מאיצים ומסייעת להאיץ אינפרנס ארוך ומתמשך, למשל יצירת פלט רב-טוקנים או הרצת שרשראות חשיבה אצל סוכנים. המיקוד הוא ביציבות השהיה ובקצב פלט עקבי, יתרון מהותי בהזרמת תשובות ובחוויית משתמש טבעית.

הקשר רחב יותר

השותפות משתלבת באסטרטגיית תשתיות רחבה של OpenAI, הכוללת התאמת חומרה לעומס עבודה ספציפי, הרחבת קיבולת ושיתופי פעולה נוספים במערך האנרגיה והדאטה. המהלך הנוכחי מת聚ד באינפרנס ולא באימון, ומכוון להרחיב את יכולות זמן האמת של שירותי ChatGPT, API וכלי מולטימודלי כגון יצירת תמונות ווידאו, מבלי לפגוע באמינות או בזמינות.

עבור מפתחים ועסקים

  • זמני תגובה קצרים יותר בשיחה, בקוד ובהרצת סוכנים מאפשרים חוויות אינטראקטיביות חדשות ומדויקות יותר.
  • היפרדות מצווארי בקבוק של תעבורה בין מאיצים צפויה לשפר את יציבות ההשהיה גם תחת עומס.
  • אינטגרציה מדורגת משמעה זמינות הולכת ומתרחבת ל-workloads שונים עד 2028.

מבט קדימה

הגדלת קיבולת האינפרנס והפחתת ההשהיה צפויות לפתוח אפיקים כמו קול בזמן אמת, שיתופי פעולה אנוש-מכונה, וכלים יצירתיים אינטראקטיביים. לצד ההתקדמות, שאלות של יעילות אנרגטית, השפעות על תמחור API וניהול עומסים צפויות לקבל תשובות ככל שהקיבולת תיכנס לפעולה בפועל במהלך השנים הקרובות.

שאלות נפוצות