מה זה זירת AI?

זירת AI הוא המקום המרכזי לחדשות AI בישראל, המספק חדשות בינה מלאכותית עדכניות, ביקורות כלי AI, מידע על אירועי AI ומומחים בתחום. הכל בעברית ומותאם לשוק הישראלי.

איך אני יכול להישאר מעודכן עם חדשות AI?

תוכלו להירשם לניוזלטר השבועי שלנו, לעקוב אחרי העמוד שלנו ברשתות החברתיות, או פשוט לבקר באתר באופן קבוע לקבלת עדכונים על חדשות AI, כלים חדשים ואירועים קרובים.

איך אני יכול למצוא כלי AI מתאים לעסק שלי?

במאגר הכלים שלנו תוכלו לסנן לפי קטגוריות שונות כמו כתיבה, תמונה, קוד, ניתוח נתונים ועוד. כל כלי כולל ביקורת מפורטת, דירוג, מידע על מחיר ויתרונות וחסרונות.

איך אני יכול למצוא אירועי AI בישראל?

בעמוד האירועים שלנו תמצאו רשימה מעודכנת של כנסים, Meetups, Webinars וסדנאות בתחום הבינה המלאכותית בישראל. כל אירוע כולל פרטי הרשמה, מיקום ותאריכים.

מה זה Nested Learning בלמידה רציפה ולמה גוגל מציגה אותו כפרדיגמה חדשה?

Nested Learning היא תפיסה מאוחדת שמטשטשת את הגבול בין ארכיטקטורת המודל לבין אלגוריתם האופטימיזציה, באמצעות שכבות מקוננות של בעיות אופטימיזציה המתעדכנות בקצבים שונים. לפי הכתבה, הגישה מפחיתה שכחה קטסטרופלית, ממנפת זיכרון אסוציאטיבי גם בשלב ה-Backprop וגם במנגנוני תשומת-לב (Attention), ומאפשרת למודלים ללמוד באופן עצמי ומתמשך לאורך זמן.

מהו Hope וכיצד הוא משתלב במסגרת Nested Learning?

Hope הוא אבטיפוס ארכיטקטוני רקורסיבי, עצמי־משתנה ווריאנט של Titans, שמסוגל לדרגות בלתי מוגבלות של למידה בתוך־הקשר (In-Context Learning). הוא מוגבר על ידי מערכת זיכרון רציפה (CMS) לטיפול בהקשרים ארוכים. לפי הכתבה, Hope מפחית פרפלקסיה ומשפר דיוק במשימות שפה ושכל ישר לעומת Transformers ומודלים רקורסיביים מודרניים, ומוביל במשימות Needle-in-a-Haystack ארוכות מול מודלים כמו Mamba2 ו‑TTT.

מהי מערכת זיכרון רציפה (CMS) וכיצד היא מפחיתה שכחה קטסטרופלית?

CMS היא רצף של מודולי זיכרון המתעדכנים בתדירויות שונות, כך שאין עוד חלוקה קשיחה בין זיכרון "קצר" ל"ארוך". עדכון מרובה־תדרים יוצר רצף יכולות זכירה רציף שמתאים ללמידה מתמשכת, משפר יעילות ניהול זיכרון ותורם להפחתת שכחה קטסטרופלית לאורך זמן.

כיצד Nested Learning שונה מגישות קיימות ללמידה רציפה כמו EWC, LwF ו‑Rehearsal, ומה החידוש באופטימיזציה?

במקום לטפל בארכיטקטורה, בזיכרון ובאופטימייזר כמודולים נפרדים, Nested Learning ממסגרת את כולם כמודולי זיכרון אסוציאטיביים הפועלים בקצבי עדכון שונים. החידוש כולל "אופטימיזטורים עמוקים" שמגדירים יעד אופטימיזציה כבעיית רגרסיה סטנדרטית (למשל L2), לקבלת גרסאות יציבות יותר של מומנטום וצבירה מול רעש ונתונים לא מושלמים. הגישה מתחברת לגל המחודש של RNNs ומודלי State‑Space (כמו משפחת Mamba) ולמגמות מטא‑למידה, אך מספקת תזמור טכני רב־רמות של עדכונים.

בלוג של גוגל: לימוד מקונן פרדיגמת ML חדשה ללמידה רציפה - חדשות AI

כפי שפורסם בבלוג של גוגל, חוקרים מציעים פרדיגמה חדשה ללמידה רציפה בשם Nested Learning. לפי דיווח ב Google Research Blog, מדובר בגישה המאחדת את הארכיטקטורה ואת כללי האופטימיזציה למערכת אחת של בעיות אופטימיזציה מקוננות. רעיון מרכזי הוא שמודלים לומדים בקצבי עדכון מרובי שכבות, וכך מפחיתים שכחה קטסטרופלית. מחקר של גוגל מעלה כי ניתן למנף זיכרון אסוציאטיבי הן באימון (Backprop) והן בארכיטקטורות כמו תשומת־לב; על פי הבלוג של גוגל, זה פותח מימד תכנוני חדש ללמידה עצמית לאורך זמן.

מי עומדים מאחורי המחקר: עלי בהרוז (Ali Behrouz), ואהאב מירוקני (Vahab Mirrokni), יחד עם מייסאם רזאויאין (Meisam Razaviyayn) ופיילין ג'ונג (Peilin Zhong). המאמר, "Nested Learning: The Illusion of Deep Learning Architectures", הוצג ב‑NeurIPS 2025.

מה חדש בפרדיגמה:

אופטימיזטורים עמוקים: במקום להסתמך על דמיון מכפלי פשוט, מגדירים את יעד האופטימיזציה כבעיית רגרסיה סטנדרטית (למשל L2), ומשיגים גרסאות יציבות יותר של מומנטום וצבירה לרעש ונתונים לא מושלמים.
מערכת זיכרון רציפה (CMS): לא עוד חלוקה קשיחה בין "קצר" ל"ארוך". רצף מודולי זיכרון מעודכנים בתדירויות שונות יוצר רצף יכולות זכירה המתאים ללמידה מתמשכת.
Hope: ארכיטקטורה רקורסיבית עצמית־משתנה, וריאנט של Titans, המסוגלת לדרגות בלתי מוגבלות של למידה בתוך־הקשר ומוגברת ב‑CMS להקשרים ארוכים.

ממצאים עיקריים: Hope מפחיתה פרפלקסיה ומשפרת דיוק במשימות שפה ושכל ישר ביחס ל‑Transformers ורקורסיביים מודרניים, ומובילה במשימות Needle‑in‑a‑Haystack ארוכות לעומת מודלים כמו Mamba2 ו‑TTT. זאת לצד ניהול זיכרון יעיל יותר בזכות מדיניות עדכון מרובת־תדרים.

הרחבה והקשר: התמודדות עם שכחה קטסטרופלית מוכרת שנים, עם גישות כמו EWC, LwF, Rehearsal ופריזות פרמטרים. Nested Learning מציע מסגור מאוחד: האופטימייזר, הזיכרון והארכיטקטורה הם כולם מודולי זיכרון אסוציאטיביים הפועלים בקצבים שונים. זה מתחבר גם לגל המחודש של RNNs ומודלי State‑Space (כמו משפחת Mamba) ולמגמת מטא־למידה, אך מעניק תשתית טכנית לתזמור רב־רמות של עדכונים.

למה זה חשוב: אם העקרונות יאומתו בקנה מידה תעשייתי, ניתן יהיה לשלב ידע חדש בלי אימון־על יקר, לאפשר עדכון מודלים על‑המכשיר, לשפר פרטיות ולצמצם תלות בזיכרון קונטקסט בלבד. עם זאת, יש אתגרי שיחזור, עלויות חישוב וקביעת קצבי עדכון אופטימליים.

בשורה התחתונה: המחקר מרחיב את מה שידענו על רציפות הלמידה במודלים גדולים ומציע דרך מעשית לצמצם שכחה, תוך יצירת שפה משותפת לתכנון ארכיטקטורות ואופטימיזציה כאחד.

בלוג של גוגל: לימוד מקונן פרדיגמת ML חדשה ללמידה רציפה

שאלות נפוצות