חזרה לחדשות
Multiverse Computing משיקה מודלי AI דחוסים לשימוש עסקים מקומיים

Multiverse Computing משיקה מודלי AI דחוסים לשימוש עסקים מקומיים

20 במרץ 2026
מערכת זירת AI

החברה הספרדית, שגייסה 215 מיליון דולר בשנה שעברה, משיקה פורטל API למפתחים ואפליקציה המדגימה יכולות של מודלים דחוסים שפועלים על מכשיר המשתמש. הצעד מגיע על רקע משבר אמון בתשתיות ענן חיצוניות ודחיפה גוברת להפעלת AI על קצה הרשת. החברה טוענת שהמודל הדחוס שלה מספק תגובות מהירות יותר בעלות נמוכה מהמודל המקורי של OpenAI.

חלופה למשבר תשתיות הענן

בעידן שבו שיעור כשלי החוב בחברות פרטיות מגיע ל-9.2 אחוזים, קרן ההון סיכון Lux Capital המליצה לחברות המסתמכות על AI לקבל התחייבויות קיבולת מחשוב בכתב, אך Multiverse Computing מציעה גישה שונה לחלוטין: מודלי AI קטנים הרצים ישירות על מכשיר המשתמש, ללא תלות בענן חיצוני.

רוצה להישאר מעודכן ב-AI?

הירשם לדיוור השבועי שלנו וקבל עדכונים, המלצות על כלים, חדשות ודוחות מיוחדים

הסטארט-אפ הספרדי, שעד כה שמר על פרופיל נמוך יחסית, משיק השבוע שני מוצרים מרכזיים: אפליקציית CompactifAI המדגימה הפעלת מודלים דחוסים באופן מקומי, ופורטל API חדש המאפשר למפתחים ולארגונים גישה ישירה למודלים הדחוסים שלה.

הטכנולוגיה: דחיסה בהשראה קוונטית

האפליקציה מציגה את Gilda, מודל קטן מספיק כדי לרוץ באופן מקומי וללא חיבור לאינטרנט. היתרון המרכזי הוא פרטיות מלאה - המידע לא עוזב את המכשיר. יחד עם הפתרון, קיים אתגר משמעותי: מכשירים ישנים יותר, במיוחד מכשירי אייפון ללא מספיק זיכרון RAM ואחסון, מנותבים אוטומטית למודלים מבוססי ענן דרך API. במצב זה, יתרון הפרטיות המרכזי נעלם.

נתוני Sensor Tower מצביעים על כך שהאפליקציה צברה פחות מ-5,000 הורדות בחודש האחרון - אינדיקציה לכך שהיעד האמיתי אינו משתמשי קצה אלא עסקים.

פורטל API לשוק הארגוני

השקת פורטל ה-API החדש מאפשרת למפתחים לגשת למודלים דחוסים של Multiverse בעצמם, ללא צורך במעבר דרך AWS Marketplace: "פורטל ה-API נותן למפתחים גישה ישירה למודלים דחוסים עם השקיפות והשליטה הנדרשות להפעלתם בסביבת ייצור", אמר המנכ"ל אנריקה ליזאסו.

אחת התכונות המרכזיות היא ניטור שימוש בזמן אמת - לא במקרה. חיסכון בעלויות מחשוב הוא אחד הגורמים העיקריים המניעים ארגונים לשקול מודלים קטנים כחלופה ל-LLM גדולים.

ביצועים מול המקור

המודל הדחוס האחרון של החברה, HyperNova 60B 2602, מבוסס על GPT-oss-120b - מודל של OpenAI שהקוד שלו זמין לציבור. לטענת Multiverse, המודל הדחוס מספק כעת תגובות מהירות יותר בעלות נמוכה מהמקור שממנו נגזר, כפי שעולה מנתוני החברה שפורסמו ב-TechCrunch על ידי אנה היים. היתרון בולט במיוחד בתהליכי עבודת תכנות אוטונומיים (קודינג), בהם AI משלים משימות תכנות מורכבות בעלות מספר שלבים.

שוק יעד ותחומי יישום

האתגר להקטין מודלים מספיק כדי לאפשר הפעלה על מכשירים ניידים תוך שמירה על שימושיות הוא משמעותי. Apple Intelligence עקפה בעיה זו על ידי שילוב מודל מקומי ומודל ענן. גישת Multiverse דומה - היא יכולה לנתב בקשות דרך API, אך המטרה העיקרית היא להציג שלמודלים מקומיים יש יתרונות מעבר לחיסכון בעלויות.

עבור עובדים בתחומים קריטיים, מודל הפועל מקומית וללא חיבור לענן מציע פרטיות וחוסן גבוהים יותר, אך הערך העסקי הגדול ביותר טמון ביישומים כמו רחפנים, לוויינים, ומערכות נוספות שבהן אי אפשר להניח קישוריות רציפה.

מצב פיננסי וצמיחה

החברה משרתת כבר למעלה מ-100 לקוחות גלובליים, כולל בנק קנדה, Bosch, ו-Iberdrola. לאחר גיוס של 215 מיליון דולר בסבב B בשנה שעברה, החברה נמצאת לפי השמועות בתהליך גיוס נוסף של 500 מיליון יורו בשווי של למעלה מ-1.5 מיליארד יורו.

עבור חברות ישראליות בתחומי אבטחת סייבר, רפואה, ואיוש, גישה למודלים שפועלים באופן עצמאי על המכשיר עשויה לפתוח דלתות ליישומים חדשים, במיוחד בסביבות עם דרישות פרטיות מחמירות או אתגרי קישוריות. השאלה היא האם הביצועים של מודלים דחוסים אלו מספיקים כבר היום עבור תרחישי שימוש קריטיים, או שמדובר עדיין בטכנולוגיה שדורשת שיפור והכוונה נוספת.

שאלות נפוצות