
XCENA גייסה 135 מיליון דולר: הזיכרון הוא צוואר הבקבוק של ה-AI
סטארטאפ שבדרום קוריאה טוען כי הבעיה האמיתית בתשתיות ה-AI אינה כוח החישוב אלא הזיכרון. XCENA פיתחה שבב המשלב יכולות עיבוד בתוך מודול ה-DRAM עצמו, ובכך מצמצם את הנסיעות היקרות בין CPU, GPU וזיכרון. הסבב הנוכחי מגיע להערכת שווי של 570 מיליון דולר.
כשה-GPU לא מספיק: הדור הבא של שבבי AI מתחיל בזיכרון
כל שאילתה שנשלחת למודל שפה גדול מפעילה רצף פעולות מוכר: נתונים יוצאים מהזיכרון, עוברים דרך ה-CPU לעיבוד ראשוני, נסעים ל-GPU לחישובים הכבדים, ואז חוזרים - וזה חוזר על עצמו לכל מילה שהמודל מייצר. הצוואר הזה הוא מובנה בארכיטקטורה, ועלותו נמדדת בשרתים, בצריכת חשמל ובמיליארדי דולרים של הוצאות תשתית.
רוצה להישאר מעודכן ב-AI?
הירשם לדיוור השבועי שלנו וקבל עדכונים, המלצות על כלים, חדשות ודוחות מיוחדים
סטארטאפ קוריאני בשם XCENA סבור שיש פתרון ישיר לבעיה הזו, וגייס השבוע 135 מיליון דולר בסבב B בהערכת שווי של 570 מיליון דולר - כך לפי דיווח של Kate Park ב-TechCrunch. סך הגיוסים של החברה עומד כעת על 185 מיליון דולר.
הרעיון: להביא את החישוב לנתונים, לא הפוך
החברה, שנוסדה ב-2022 על ידי Jin Kim (מנכ"ל), Dohun Kim (CTO) ו-Harry Juhyun Kim (CPO) - שלושתם בוגרי Samsung ו-SK Hynix - פיתחה שבב בשם MX1 המתחבר ל-CPU באמצעות CXL (Compute Express Link). הרעיון המרכזי: להכניס יכולות עיבוד ישירות לתוך מודול ה-DRAM, כך שפעולות נפוצות כמו ניהול KV cache, עיבוד מקדים ואחסון ביניים יטופלו במקום בו הנתונים כבר נמצאים, מבלי לצאת לנסיעה יקרה אל ה-GPU.
"GPU מצטיין בכפל מטריצות - המתמטיקה הכבדה שמאחורי אימון מודלים. אבל תזמור הנתונים שמסביב - עיבוד מקדים, ניהול KV cache, שמירה במטמון - עדיין רץ על CPU. השבב שלנו מטפל במשימות האלה ישירות בתוך מודול הזיכרון", אמר Kim בראיון שנסקר ב-TechCrunch.
החברה טוענת כי מה שדורש היום 10 שרתים יוכל לרוץ על שרת אחד בלבד - טענה שאם תאומת בקנה מידה תעשייתי, תהיה לה השפעה דרמטית על עלויות ה-inference של מודלים גדולים.
שוק הזיכרון בעיצומו של שינוי
התזמון אינו מקרי. בחודש האחרון חצו שלוש חברות הזיכרון הגדולות בעולם - Samsung, SK Hynix ו-Micron - הערכת שווי של טריליון דולר כל אחת לראשונה בהיסטוריה. הביקוש לזיכרון במערכות AI גדל בעקביות מאז המחצית השנייה של 2024, ומשקיעים מזהים כי ה-GPU לבדו אינו מספיק לתת מענה לדרישות ה-inference המתגברות.
המתחרות הקרובות של XCENA הן Astera Labs ו-Marvell, שתיהן חברות ציבוריות הנסחרות ב-Nasdaq. לדברי Kim, היתרון התחרותי של XCENA נעוץ בקניין רוחני: "יש לנו אלפי ליבות", בעוד שהגישה של Marvell מסתמכת על מספר קטן של ליבות כלליות. הליבות של XCENA מבוססות על RISC-V - ארכיטקטורת שבבים קוד-פתוח - וכל ליבה תוכננה להיות קטנה ויעילה. החברה מפתחת בתוך הבית גם את ההיררכיה הפנימית של הזיכרון, את ה-interconnect bus ואת ה-DRAM controller - רמת אינטגרציה אנכית שרוב חברות השבבים מעדיפות לרכוש מגורמים חיצוניים.
אופק מסחרי: 2027
ה-MX1 עדיין בשלב אב-טיפוס. ייצור המוני צפוי להתחיל בקווי הייצור של Samsung בסוף 2026, עם הכנסות ראשונות הצפויות ב-2027. הלקוחות הטבעיים הם hyperscalers - חברות כמו Microsoft, Google ו-Amazon - המשקיעות עשרות מיליארדי דולרים בשנה בתשתיות AI, שם גם שיפור קטן ביעילות הזיכרון מתורגם לחיסכון של מאות מיליוני דולרים.
סבב ה-B הונהג על ידי קרנות ההון-סיכון הקוריאניות Atinum ו-IMM Investment, לצד Corstone Asia והמשקיעים הקיימים SBI Investment ו-Mirae Asset Capital. לחברה יש יותר מ-90 עובדים במשרדים בפנגיו (מרכז הטכנולוגיה מחוץ לסיאול) ובסאניוויל, קליפורניה.
מבחינת המשמעות לשוק הישראלי: חברות כמו Habana Labs (נרכשה על ידי Intel), Hailo ו-Axonim, הפועלות בתחום שבבי ה-AI, עוקבות מקרוב אחר מגמת ה-memory-centric computing. הכיוון שאליו מצביעה XCENA - הזזת כוח החישוב אל תוך מודול הזיכרון - עשוי להגדיר מחדש את שדה התחרות על תשתיות ה-AI ב-2027 ואילך.
