
GLM-5.2: מודל AI פתוח עם חלון הקשר של מיליון טוקנים שמאתגר את Claude ו-GPT
זד.איי מציגה את GLM-5.2, מודל שפה פתוח ברישיון MIT המיועד למשימות קוד ארוכות טווח, עם חלון הקשר של מיליון טוקנים, שיפורים בארכיטקטורה וביצועים שמקרבים את עולם הקוד הפתוח לחזית המודלים הסגורים.
GLM-5.2 מסמן שלב חדש במרוץ מודלי ה-AI הפתוחים
חברת Z.ai מציגה את GLM-5.2 כמודל דגל חדש למשימות ארוכות טווח, ובעיקר למשימות פיתוח תוכנה מורכבות שנמשכות שעות ודורשות שמירה על הקשר רחב, זיכרון עבודה יציב וקבלת החלטות עקבית. לפי הפרסום המקורי בבלוג Hugging Face, המודל מציע חלון הקשר של מיליון טוקנים, רישיון MIT פתוח וללא מגבלות אזוריות, ושיפור משמעותי ביחס ל-GLM-5.1.
רוצה להישאר מעודכן ב-AI?
הירשם לדיוור השבועי שלנו וקבל עדכונים, המלצות על כלים, חדשות ודוחות מיוחדים
החשיבות כאן אינה רק במספר המרשים של מיליון טוקנים. בשוק ה-AI כבר ראינו לא מעט הכרזות על חלונות הקשר גדולים, אך בפועל מודלים רבים מתקשים לשמור על דיוק כאשר ההקשר מתמלא בקוד, לוגים, קבצי תיעוד, ניסיונות כושלים והוראות סותרות. GLM-5.2 מנסה לתת מענה בדיוק לנקודה הזו: לא רק לקרוא יותר, אלא לבצע עבודה הנדסית ממושכת בתוך הקשר עמוס ורועש.
למה מיליון טוקנים חשובים לפיתוח תוכנה
בעולם של סוכני קוד, חלון הקשר גדול מאפשר למודל לעבוד על מאגרי קוד שלמים, להבין תלות בין מודולים, לעקוב אחר היסטוריית ניסויים ולבצע דיבוג רב שלבי בלי לאבד את חוט המחשבה. המשמעות העסקית ברורה: צוותים שמפתחים כלי AI פנימיים, סביבות DevOps וסוכני אוטומציה יכולים לצמצם את הצורך בפיצול משימות מלאכותי ובניהול הקשר חיצוני יקר.
במדדי קוד ארוכי טווח, זד.איי מדווחת כי GLM-5.2 מתקרב לרמת Claude Opus 4.8, עוקף את GPT-5.5 בחלק מהמדדים, ומדורג כמודל הקוד הפתוח החזק ביותר בסדרת מבחנים כמו FrontierSWE, PostTrainBench ו-Terminal-Bench 2.1. יש להתייחס למספרים בזהירות, משום שמדדי סוכנים עדיין רגישים מאוד להגדרות הרצה, כלים, מגבלות זמן וסביבת בדיקה. ובכל זאת, הכיוון ברור: הפער בין מודלים פתוחים למודלים סגורים במשימות פיתוח מתוחכמות ממשיך להצטמצם.
הארכיטקטורה: פחות חישוב, יותר הקשר
אחד החידושים המרכזיים ב-GLM-5.2 הוא IndexShare, מנגנון שמאפשר לשתף אינדקסר בין כמה שכבות קשב דליל. במקום לחשב מחדש פעולות יקרות בכל שכבה, המודל עושה שימוש חוזר באינדקסים, ובכך מפחית את עלות החישוב לכל טוקן במיוחד בהקשרים ארוכים. זהו שינוי חשוב משום שבחלון של מיליון טוקנים הבעיה כבר אינה רק איכות המודל, אלא גם עלות ההפעלה, זיכרון ה-KV-cache וקצב התגובה.
בנוסף, זד.איי משפרת את שכבת MTP לצורך speculative decoding, טכניקה שמנסה להאיץ יצירת טקסט באמצעות ניבוי כמה צעדים קדימה. לפי החברה, השילוב בין IndexShare, שיתוף KV, דגימת דחייה ואימון מבוסס TV loss העלה את אורך הקבלה בעד 20 אחוז. במילים פשוטות, המודל אמור לייצר תשובות מהר יותר בלי לשלם מחיר גדול באיכות.
היתרון האסטרטגי של קוד פתוח
הנקודה הדרמטית ביותר אינה רק טכנית אלא אסטרטגית. מודל פתוח ברמה גבוהה, עם רישיון MIT, מעניק לארגונים אפשרות להריץ תשתיות AI מקומיות, להתאים אותן למדיניות פרטיות פנימית ולהקטין תלות בספקי ענן ומודלים סגורים. עבור חברות ביטחוניות, פיננסיות, בריאות וארגוני תוכנה גדולים, זהו יתרון משמעותי.
עם זאת, GLM-5.2 גם מדגיש את האתגרים החדשים של עידן הסוכנים. החברה מתארת מנגנוני Anti-Hack שנועדו למנוע ממודלים לרמות מבחני קוד, לקרוא קבצים מוסתרים או למשוך פתרונות מהרשת. זו תזכורת חשובה: ככל שסוכן AI נעשה יעיל יותר, כך גדל הצורך בבקרת התנהגות, סביבות הרצה מבודדות ומדדי הערכה אמינים.
GLM-5.2 אינו רק עוד מודל גדול. הוא עדות לכך שהחזית הפתוחה של ה-AI מתבגרת, עוברת ממדדי צ'אט כלליים אל ביצוע עבודה הנדסית מתמשכת, ומתחילה להציב חלופה ממשית למודלים הסגורים גם בשכבת הפרודוקטיביות הארגונית.
