איפה אפשר לקרוא חדשות AI בעברית?

זירת AI הוא אתר חדשות AI מוביל בישראל, המתעדכן מדי יום עם חדשות בינה מלאכותית בעברית. האתר מכסה עדכוני AI מרחבי העולם, כולל חדשות על ChatGPT, Claude, Gemini, סטארטאפי AI ומחקרים פורצי דרך. כל התכנים מותאמים לקהילה העסקית והמדעית בישראל.

מה זה זירת AI?

זירת AI הוא אתר חדשות בינה מלאכותית מוביל בישראל. האתר מספק חדשות AI עדכניות בעברית, דירוג והשוואת מודלי AI, סקירות כלי AI, מחקרים אקדמיים ואירועי AI. זירת AI מתעדכן מדי יום ומכסה את כל ההתפתחויות החשובות בעולם הבינה המלאכותית.

איך אני יכול להישאר מעודכן עם חדשות AI?

תוכלו להירשם לניוזלטר השבועי של זירת AI, לעקוב אחרי העמוד שלנו ברשתות החברתיות, או לבקר באתר חדשות AI שלנו באופן קבוע. אנו מפרסמים חדשות AI חדשות מדי יום, כולל עדכונים על מודלים חדשים, כלי AI וחדשות טכנולוגיה.

איך אני יכול למצוא כלי AI מתאים לעסק שלי?

במאגר הכלים שלנו תוכלו לסנן לפי קטגוריות שונות כמו כתיבה, תמונה, קוד, ניתוח נתונים ועוד. כל כלי כולל ביקורת מפורטת, דירוג, מידע על מחיר ויתרונות וחסרונות.

איך אני יכול למצוא אירועי AI בישראל?

בעמוד האירועים שלנו תמצאו רשימה מעודכנת של כנסים, Meetups, Webinars וסדנאות בתחום הבינה המלאכותית בישראל. כל אירוע כולל פרטי הרשמה, מיקום ותאריכים.

מה זה RLM (Recursive Language Models) ולמה זה חשוב?

RLM היא פרדיגמת הסקה חדשה ממעבדות MIT שבה מודל השפה מטפל בטקסט ארוך כסביבה חיצונית ולא כקלט ישיר. באמצעות רקורסיה וכתיבת קוד, המודל מפרק וניגש פרוגרמטית לחלקים רלוונטיים של הטקסט, וכך מסוגל לעבד עשרות מיליוני טוקנים – עד פי 100 מעבר לחלון ההקשר הסטנדרטי של מודלים מודרניים.

מהי בעיית חלון ההקשר המוגבל ו”ריקבון הקשר” במודלי שפה?

למודלים כמו GPT-5 יש חלון הקשר של כ-272 אלף טוקנים. מעבר לכך, גם בתוך החלון מתרחשת תופעת “ריקבון הקשר” (context rot) שבה איכות התשובות יורדת ככל שהטקסט מתארך. זה פוגע במיוחד במשימות המחייבות נגישות צפופה לכל חלקי הטקסט, כמו ניתוח מאגרי קוד ענקיים או סקירות עומק.

כיצד RLM מצליח לעבד טקסטים ארוכים פי 100 מהחלון הרגיל?

במקום להזין את כל הטקסט לרשת, RLM שומר את הטקסט בסביבה חיצונית ומעביר למודל רק מטא-דאטה וקטע קצר. המודל כותב קוד שחוקר, מחלק ומנווט לטווחי טקסט ספציפיים, וקורא לעצמו רקורסיבית על קטעים רלוונטיים. כך הוא עוקף את מגבלת חלון ההקשר הפיזי ושומר על איכות לאורך טקסטים עצומים.

איך זה עובד בפועל ומהו REPL בהקשר של RLM?

RLM פועל בתוך סביבת תכנות אינטראקטיבית (REPL) שבה הטקסט נשמר כמשתנה. המודל: - כותב קוד לפיצול הטקסט לחלקים - משתמש בביטויים רגולריים לחיפוש מידע רלוונטי - קורא לעצמו רקורסיבית על קטעים נבחרים - שומר תוצאות במשתנים ומשלב אותן תכנותית למשל, לשאלה על פסטיבל בפיליפינים, המודל מאתר אוטומטית קטעים עם “festival” ושמות מקומות בפיליפינים ומעבד רק אותם.

אילו תוצאות השיג RLM במבחנים ומה הפער מול מודלים רגילים?

בארבע משימות ברמות קושי שונות (מהשבה מידע ועד OOLONG-Pairs), RLM שמר על ביצועים גבוהים גם כשאורך הטקסט חרג בהרבה מהחלון המקורי, בעוד מודל הבסיס קרס. במשימת BrowseComp-Plus, המבוססת על 1,000 מסמכים, RLM עם GPT-5 הגיע לדיוק של 91.3% לעומת 0% למודל הבסיסי שלא הצליח להכיל את כל הנתונים.

האם חייבים מודל ענק? מה מראה הניסוי עם Qwen3-8B?

לא. החוקרים אימנו מודל קטן יחסית (Qwen3-8B) לעבוד בסגנון RLM עם 1,000 דוגמאות בלבד, וקיבלו שיפור ממוצע של 28.3% בארבע משימות. RLM-Qwen3-8B התקרב לביצועי GPT-5 בשלוש משימות, מה שמדגים שהשיטה ישימה גם במודלים קטנים יותר עם אימון ממוקד.

מה לגבי עלויות? האם RLM יקר יותר להרצה?

למרות העיבוד הרקורסיבי והקוד, העלות הכוללת דומה למודלים רגילים בזכות ניהול משאבים חכם. בפועל, RLM מחליף עיבוד “בבת אחת” בעיבוד פרוגרמטי-בררני שמפחית בזבוז הקשר ושומר על יעילות תקציבית.

לאילו שימושים RLM מתאים במיוחד?

למשימות שדורשות עיבוד של כמויות מידע אדירות עם גישה צפופה לכל חלקי הטקסט: מחקר מדעי, סקירת מסמכים משפטיים, ניתוח מאגרי קוד גדולים, ומערכות חיפוש ושאילתות מורכבות על אוספים רחבי היקף.

במה RLM שונה מדחיסת הקשר או סיכום חוזר?

גישות דחיסה/סיכום מניחות שאפשר לשכוח פרטים מוקדמים כדי לפנות מקום לחדשים. RLM, לעומת זאת, מספק גישה פרוגרמטית-רקורסיבית לכל חלק בטקסט לפי צורך, משלב קוד וחיפוש חיצוני, ומאפשר עבודה סמנטית שהיקפה עשוי לגדול פרופורציונלית לריבוע אורך הטקסט – ולא רק ליניארית.

איפה מוצאים את הקוד והמאמר?

המחקר זמין כמאמר ב-arXiv והקוד פתוח ב-GitHub, לצד תיעוד וסטנדרטי בנצ’מרקים רלוונטיים (LongBench-v2, OOLONG). הקישורים המלאים מופיעים בסוף הכתבה.

חוקרי MIT פיתחו מודל שיכול לעבד טקסטים פי 100 מאורך החלון הקונטקסטואלי - חדשות AI

חוקרים ב-MIT במחקר חדש שפורסם גילו שאפשר להרחיב באופן דרמטי את יכולת העיבוד של מודלי שפה גדולים באמצעות גישה חדשנית שמטפלת בטקסטים ארוכים כסביבה חיצונית במקום להזין אותם ישירות למודל.

המחקר, שנערך על ידי אלכס ז'אנג, טים קראסקה ועומר ח'טאב, מציג את RLM (Recursive Language Models), פרדיגמת הסקה חדשה שמאפשרת למודלי שפה לעבד טקסטים באורך של עשרות מיליוני טוקנים, עד פי 100 מעבר לחלון ההקשר הסטנדרטי.

הבעיה: חלון ההקשר המוגבל

מודלי שפה מתקדמים כמו GPT-5 מוגבלים לחלון הקשר של כ-272 אלף טוקנים. אבל גם בתוך המגבלה הזו, הם סובלים מתופעה שנקראת "ריקבון הקשר" (context rot), שבה איכות התשובות יורדת ככל שהטקסט הנכנס מתארך. זה הופך לבעיה משמעותית במיוחד כשמדובר במשימות שדורשות עיבוד של מאות מיליוני טוקנים, כמו ניתוח מאגרי קוד ענקיים או מחקר מעמיק.

הגישות הקיימות לטיפול בבעיה, כמו דחיסת הקשר או סיכום חוזר, לא מספיק יעילות במשימות שדורשות גישה צפופה לכל חלקי הטקסט. הן מניחות שאפשר לשכוח פרטים מוקדמים כדי לפנות מקום לתוכן חדש.

הפתרון: טיפול בטקסט כסביבה חיצונית

התובנה המרכזית של RLM היא שטקסטים ארוכים לא צריכים להיכנס ישירות לרשת הנוירונים. במקום זה, הם מטופלים כחלק מהסביבה שהמודל מתקשר איתה באופן סימבולי ורקורסיבי.

במקום להזין את כל הטקסט למודל, RLM יוצר סביבת תכנות (REPL) שבה הטקסט נשמר כמשתנה. המודל מקבל רק מטא-דאטה על הטקסט, כמו אורכו וקטע קצר ממנו, ואז כותב קוד שבוחן, מפרק וקורא לעצמו באופן רקורסיבי על חלקים שונים של הטקסט.

הגישה הזו מאפשרת למודל להפעיל עצמו על קטעי טקסט ספציפיים בצורה פרוגרמטית, בלי להיות מוגבל לחלון ההקשר הפיזי שלו.

תוצאות מרשימות במבחנים

החוקרים בחנו את RLM על ארבע משימות שונות ברמות מורכבות שונות, החל מחיפוש מידע פשוט ועד לניתוח מורכב של זוגות נתונים. במבחנים השתמשו במודלים מתקדמים כמו GPT-5 ו-Qwen3-Coder-480B.

הממצאים היו דרמטיים. בעוד ש-GPT-5 רגיל הראה ירידה חדה בביצועים ככל שהטקסט התארך, RLM שמבוסס על אותו מודל שמר על ביצועים גבוהים גם בטקסטים שחרגו בהרבה מחלון ההקשר המקורי. במשימות מורכבות במיוחד, כמו OOLONG-Pairs שדורשת עיבוד של כל זוגות הנתונים בטקסט, ההפרש היה מהותי.

במשימת BrowseComp-Plus, למשל, שכוללת מענה על שאלות מתוך אלף מסמכים, RLM עם GPT-5 השיג דיוק של 91.3 אחוזים, לעומת 0 אחוזים של המודל הבסיסי שלא הצליח בכלל להכיל את כל הנתונים.

אימון מודל קטן שמתחרה בענקים

בניסוי מעניין במיוחד, החוקרים אימנו מודל קטן יחסית של 8 מיליארד פרמטרים (Qwen3-8B) להיות RLM מקורי. באמצעות אימון פשוט על 1,000 דוגמאות בלבד מתחומים לא קשורים, הם השיגו שיפור ממוצע של 28.3 אחוזים בארבע משימות.

המודל המאומן הזה, RLM-Qwen3-8B, הצליח להגיע לרמת ביצועים קרובה ל-GPT-5 בשלוש משימות, למרות שהוא קטן בהרבה. זה מראה שהגישה לא דורשת מודלים ענקיים והיא ניתנת לשיפור מהיר עם אימון ממוקד.

איך זה עובד בפועל

כשהמודל מקבל טקסט ארוך, הוא כותב קוד שמחלק אותו לקטעים, מבצע חיפוש מבוסס ביטויים רגולריים למציאת מידע רלוונטי, וקורא לעצמו על כל קטע. התוצאות נשמרות במשתנים, והמודל יכול לשלב אותן בצורה תכנותית.

למשל, במשימה שדרשה מציאת מידע על פסטיבל בפיליפינים, RLM חיפש אוטומטית קטעים שמכילים את המילה "festival" ושמות של מקומות בפיליפינים, ואז עיבד רק את הקטעים הרלוונטיים.

משמעות למערכות AI עתידיות

המחקר פותח דלת לעידן חדש של מערכות AI שיכולות לטפל במשימות מורכבות שדורשות עיבוד של כמויות אדירות של מידע. זה יכול לשנות את הדרך שבה אנו משתמשים ב-AI למחקר מדעי, ניתוח מסמכים משפטיים, הבנת מאגרי קוד גדולים ועוד.

בניגוד לגישות קודמות, RLM משלב את היתרונות של כתיבת קוד, גישה למידע חיצוני ורקורסיה בצורה שמאפשרת לבצע עבודה סמנטית שגודלה יכול להיות פרופורציונלי לריבוע אורך הטקסט, ולא רק ליניארי.

הקוד של המחקר זמין כקוד פתוח ב-GitHub, מה שמאפשר לחוקרים ומפתחים נוספים לבנות על העבודה הזו ולשפר אותה.

חוקרי MIT פיתחו מודל שיכול לעבד טקסטים פי 100 מאורך החלון הקונטקסטואלי