איפה אפשר לקרוא חדשות AI בעברית?

זירת AI הוא אתר חדשות AI מוביל בישראל, המתעדכן מדי יום עם חדשות בינה מלאכותית בעברית. האתר מכסה עדכוני AI מרחבי העולם, כולל חדשות על ChatGPT, Claude, Gemini, סטארטאפי AI ומחקרים פורצי דרך. כל התכנים מותאמים לקהילה העסקית והמדעית בישראל.

מה זה זירת AI?

זירת AI הוא אתר חדשות בינה מלאכותית מוביל בישראל. האתר מספק חדשות AI עדכניות בעברית, דירוג והשוואת מודלי AI, סקירות כלי AI, מחקרים אקדמיים ואירועי AI. זירת AI מתעדכן מדי יום ומכסה את כל ההתפתחויות החשובות בעולם הבינה המלאכותית.

איך אני יכול להישאר מעודכן עם חדשות AI?

תוכלו להירשם לניוזלטר השבועי של זירת AI, לעקוב אחרי העמוד שלנו ברשתות החברתיות, או לבקר באתר חדשות AI שלנו באופן קבוע. אנו מפרסמים חדשות AI חדשות מדי יום, כולל עדכונים על מודלים חדשים, כלי AI וחדשות טכנולוגיה.

איך אני יכול למצוא כלי AI מתאים לעסק שלי?

במאגר הכלים שלנו תוכלו לסנן לפי קטגוריות שונות כמו כתיבה, תמונה, קוד, ניתוח נתונים ועוד. כל כלי כולל ביקורת מפורטת, דירוג, מידע על מחיר ויתרונות וחסרונות.

איך אני יכול למצוא אירועי AI בישראל?

בעמוד האירועים שלנו תמצאו רשימה מעודכנת של כנסים, Meetups, Webinars וסדנאות בתחום הבינה המלאכותית בישראל. כל אירוע כולל פרטי הרשמה, מיקום ותאריכים.

מה זה חלון הקשר (Context Window) במודלי שפה?

חלון הקשר הוא כמות הטקסט (טוקנים) שמודל שפה יכול “להחזיק בראש” בכל בקשה. גם אם החלון מגיע למאות אלפים או למיליון טוקנים, מסמכים ארוכים במיוחד עדיין חורגים מהמגבלה, מעלים עלויות, ועלולים לגרום לתופעת “אובדן באמצע” שבה מידע חשוב באמצע הטקסט מקבל פחות משקל.

מה זה RLM (Recursive Language Models) ואיך זה עוזר עם מסמכים ענקיים?

RLM היא גישה שבה לא שולחים את כל המסמך למודל בבת אחת. במקום זאת, המסמך נטען כסביבה חיצונית, והמודל הראשי כותב קוד (למשל Python) כדי לחפש, לחתוך ולאתר קטעים רלוונטיים. רק כשצריך הבנה סמנטית מפעילים מודל משנה על קטע קטן, וכך מצמצמים עומס והקשר.

למה לא פשוט להגדיל את חלון ההקשר למיליון טוקנים ומעלה?

הגדלת חלון ההקשר לא פותרת הכל: עדיין קיימת תקרת קלט מול מסמכים של מיליוני תווים, העלויות יכולות להיות גבוהות, ונשארת בעיית “האובדן באמצע” שבה מידע במרכז הטקסט מקבל פחות תשומת לב. הגישה המוצעת מעבירה את העבודה לחיפוש ואיסוף ממוקד, במקום “קריאה” רציפה של הכל.

מה זה “אובדן באמצע” (Lost in the Middle) ולמה זה קורה?

“אובדן באמצע” הוא מצב שבו מודלי שפה נוטים להתייחס יותר חזק לתחילת הטקסט ולסופו, ופחות למידע שנמצא באמצע הקלט הארוך. כשמזינים מסמכים גדולים, פרטים קריטיים עלולים להישכח או לקבל משקל נמוך, ולכן תשובות הופכות לפחות אמינות גם אם המידע הופיע במסמך.

מה התפקיד של Code Interpreter כסביבת עבודה מתמשכת בניתוח מסמכים?

Code Interpreter מאפשר להריץ קוד בסביבה מבודדת שבה המסמך נשמר כמשתנה, ותוצאות ביניים נשמרות לאורך זמן כ”זיכרון עבודה”. במקום לדחוס את כל המסמך להקשר, המודל מבצע חיפוש טקסטואלי, בדיקות וחילוץ נתונים, ומפעיל קריאות ממוקדות למודלי שפה רק על קטעים רלוונטיים.

האם הגישה הזו משפרת ביצועים ודיוק בפועל?

כן. במבחן שאלות-תשובות על דוחות פיננסיים ארוכים במיוחד (עד ~שני מיליון תווים), RLM הגיע ל-100% הצלחה בכל התצורות שנבדקו, לעומת שיעורי הצלחה נמוכים יותר בגישות חלון הקשר גדול. גם הדיוק השתפר: מודלים שונים הציגו קפיצה משמעותית באחוזי הדיוק מול גישת Long Context.

מה החסרונות של RLM לארגונים מבחינת עלות וזמן?

זה לא פתרון “חינמי”: ניתוח עשוי לכלול קריאות רבות למודל ראשי ולמודלי משנה, ולכן זמן הריצה והעלות גדלים ולעיתים נמשכים דקות. עם זאת, עבור עיבוד אצווה, מחקר ארגוני או מסמכים שחורגים מהקשר, זהו דפוס ארכיטקטוני יעיל שמאפשר חקירה איטרטיבית וכלים מתקדמים.

דרך לעקוף את מגבלת חלון ההקשר במודלי AI - חדשות AI

ענקית הענן מציגה גישה מעשית להתמודדות עם אחת המגבלות המרכזיות של מודלי שפה גדולים: חלון ההקשר. גם כאשר מודלים תומכים במאות אלפי ואף במיליון טוקנים, ארגונים שמנסים לנתח דוחות כספיים, מאגרי קוד, מסמכים משפטיים או חומרי מחקר בהיקף של מיליוני תווים עדיין נתקלים בתקרת קלט, בעלויות גבוהות ובתופעת "האובדן באמצע", שבה מידע חשוב במרכז הטקסט זוכה לפחות תשומת לב מצד המודל.

במקום להגדיל את החלון, להפוך את המסמך לסביבת עבודה

הפתרון ש-AWS מתארת מבוסס על Recursive Language Models, או RLM. במקום לשלוח את כל המסמך למודל בבת אחת, המסמך נטען כסביבה חיצונית שאליה המודל ניגש באמצעות קוד. המודל הראשי מקבל את השאלה ואת תיאור הכלים הזמינים, כותב קוד Python כדי לחפש, לחתוך ולבדוק חלקים רלוונטיים במסמך, ורק כאשר נדרשת הבנה סמנטית הוא מפעיל מודל משנה על קטע מצומצם.

כך, המסמך המלא אינו תופס מקום בחלון ההקשר של המודל הראשי. תוצאות ביניים נשמרות כמשתנים בסביבת Python מתמשכת, מה שמאפשר למודל לבנות זיכרון עבודה לאורך זמן בלי להציף את ההקשר. מבחינה הנדסית, מדובר בשילוב בין תכנון סוכן, ביצוע קוד, חיפוש טקסטואלי וקריאות ממוקדות למודלי שפה.

AgentCore כזיכרון עבודה מתמשך

היישום שמוצג משתמש ב-Amazon Bedrock AgentCore Code Interpreter כסביבת הרצה מבודדת, יחד עם Strands Agents SDK לתזמור הסוכן. המסמך נטען לתוך סביבת הקוד כמשתנה Python, ופונקציה בשם llm_query מאפשרת לסביבה לבצע קריאות ישירות למודלי יסוד ב-Amazon Bedrock. במצב רשת ציבורי, ה-Code Interpreter יכול לשלוח בקשות החוצה ל-Bedrock, בעוד שהמודל הראשי נשאר ממוקד בתכנון צעדי החיפוש והניתוח.

המשמעות למפתחים היא שהמודל אינו רק "קורא" טקסט ארוך, אלא פועל כמו אנליסט שמחפש אינדקסים, מאתר טבלאות, בודק פונקציות במאגר קוד, מפצל משימות ומאגד ממצאים. זהו שינוי חשוב במיוחד בעולמות כמו ניתוח דוחות שנתיים, בדיקות תאימות, מחקר רפואי וסקירת קוד בהיקפים גדולים.

תוצאות: יותר הצלחה, יותר דיוק

במבחן Financial Multi-Document QA מתוך LongBench v2, שכלל שאלות על דוחות פיננסיים באורך של עד כשני מיליון תווים, גישת RLM השיגה שיעור הצלחה של 100 אחוז בכל התצורות שנבדקו. לשם השוואה, גישת Base עם חלון הקשר של 200 אלף טוקנים הצליחה לעבד רק 46.7 אחוז מהשאלות, ואילו Long Context עם חלון של מיליון טוקנים הגיעה ל-93.3 אחוז.

גם ברמת הדיוק נרשם שיפור. Claude Opus 4.6 עם RLM הגיע ל-80 אחוז דיוק, לעומת 66.7 אחוז בגישת Long Context. Claude Sonnet 4.6 השתפר מ-60 אחוז ל-73.3 אחוז. במבחן נוסף להבנת מאגרי קוד, שכלל ריפוזיטוריז באורך של עד יותר מ-16 מיליון תווים, RLM שוב הגיע ל-100 אחוז הצלחה ושיפר את הדיוק בכל המודלים שנבדקו.

לא פתרון חינמי, אבל דפוס חשוב לארגונים

AWS מציינת כי המחיר הוא זמן ריצה ועלות. כל ניתוח עשוי לכלול מספר קריאות למודל הראשי ולמודלי משנה, ולעיתים להימשך דקות. עם זאת, עבור עיבוד אצווה, מחקר ארגוני או ניתוח מסמכים שאינם מתאימים לחלון ההקשר, מדובר בדפוס ארכיטקטוני משמעותי. ייתכן שזהו אחד הכיוונים החשובים ביותר בבניית מערכות AI ארגוניות: לא להסתמך רק על מודל גדול יותר, אלא לתת למודל כלים, זיכרון עבודה ויכולת חקירה איטרטיבית.

דרך לעקוף את מגבלת חלון ההקשר במודלי AI

במקום להגדיל את החלון, להפוך את המסמך לסביבת עבודה

רוצה להישאר מעודכן ב-AI?

AgentCore כזיכרון עבודה מתמשך

תוצאות: יותר הצלחה, יותר דיוק

לא פתרון חינמי, אבל דפוס חשוב לארגונים

שאלות נפוצות