איפה אפשר לקרוא חדשות AI בעברית?

זירת AI הוא אתר חדשות AI מוביל בישראל, המתעדכן מדי יום עם חדשות בינה מלאכותית בעברית. האתר מכסה עדכוני AI מרחבי העולם, כולל חדשות על ChatGPT, Claude, Gemini, סטארטאפי AI ומחקרים פורצי דרך. כל התכנים מותאמים לקהילה העסקית והמדעית בישראל.

מה זה זירת AI?

זירת AI הוא אתר חדשות בינה מלאכותית מוביל בישראל. האתר מספק חדשות AI עדכניות בעברית, דירוג והשוואת מודלי AI, סקירות כלי AI, מחקרים אקדמיים ואירועי AI. זירת AI מתעדכן מדי יום ומכסה את כל ההתפתחויות החשובות בעולם הבינה המלאכותית.

איך אני יכול להישאר מעודכן עם חדשות AI?

תוכלו להירשם לניוזלטר השבועי של זירת AI, לעקוב אחרי העמוד שלנו ברשתות החברתיות, או לבקר באתר חדשות AI שלנו באופן קבוע. אנו מפרסמים חדשות AI חדשות מדי יום, כולל עדכונים על מודלים חדשים, כלי AI וחדשות טכנולוגיה.

איך אני יכול למצוא כלי AI מתאים לעסק שלי?

במאגר הכלים שלנו תוכלו לסנן לפי קטגוריות שונות כמו כתיבה, תמונה, קוד, ניתוח נתונים ועוד. כל כלי כולל ביקורת מפורטת, דירוג, מידע על מחיר ויתרונות וחסרונות.

איך אני יכול למצוא אירועי AI בישראל?

בעמוד האירועים שלנו תמצאו רשימה מעודכנת של כנסים, Meetups, Webinars וסדנאות בתחום הבינה המלאכותית בישראל. כל אירוע כולל פרטי הרשמה, מיקום ותאריכים.

מה זה Machine Unlearning ולמה הוא חשוב בבינה מלאכותית?

Machine Unlearning, או מחיקת למידה ממודלים, הוא תחום שמטרתו לגרום למודל AI “לשכוח” מידע מסוים בלי לאמן אותו מחדש מאפס. הוא חשוב במיוחד כאשר יש צורך למחוק מידע אישי, רגיש או משפטית מחייב, תוך שמירה על ביצועי המודל ועל עלויות תפעול סבירות.

איך אפשר להוכיח שמודל AI באמת שכח מידע?

כדי להוכיח שמודל AI שכח מידע, לא מספיק לבדוק אם הפלטים שלו דומים למודל אחר. הגישה החדשה משווה האם המודל שעבר מחיקה קרוב יותר למודל שאומן מראש בלי המידע הרגיש, או למודל המקורי שנחשף אליו ועלול עדיין לזכור אותו.

מה הבעיה בבדיקות הקיימות למחיקת מידע ממודלים?

בדיקות קיימות עלולות לטעות משום שגם שני מודלים שאומנו על אותם נתונים יכולים להתנהג אחרת בגלל אקראיות באימון, גודל אצווה או פרמטרים טכניים. בנוסף, כלים מסוימים מזהים שינוי רחב בלבד ועלולים לפספס דליפות נקודתיות שמופיעות רק בשאילתות ספציפיות מאוד.

מה זה f-Divergence ואיך הוא קשור לבדיקת מודלי AI?

f-Divergence היא משפחת מדדים סטטיסטיים למדידת פערים בין התפלגויות. בהקשר של מודלי AI, היא מאפשרת לבדוק עד כמה הפלטים של מודל שעבר מחיקה דומים למודל בטוח לעומת מודל שראה מידע רגיש. מדדים שונים מתאימים לזיהוי סוגי דליפה שונים.

מה זה Hockey-stick divergence ולמה הוא חשוב לפרטיות?

Hockey-stick divergence הוא מדד ממשפחת f-Divergence שמתאים במיוחד להקשרים של פרטיות דיפרנציאלית. הוא מאפשר להגדיר תקציב בטיחות ולהתעלם מהבדלים קטנים שאינם מהווים סיכון ממשי, תוך זיהוי חריגות שעלולות להעיד על דליפת מידע רגיש מהמודל.

איך הבדיקה החדשה עשויה להשפיע על רגולציה וארגונים?

המסגרת החדשה עשויה לאפשר לארגונים לקבל ראיות סטטיסטיות לכך שמודל מחק מידע כנדרש, במקום להסתפק בהצהרות ספקים. הדבר רלוונטי במיוחד לתחומי פיננסים, בריאות, ביטוח וסייבר, שבהם עמידה בדרישות פרטיות, ביקורת ספקים וניהול סיכוני מודלים הופכים קריטיים יותר.

כך מוכיחים שמודל AI באמת שכח מידע - חדשות AI

למה "לשכוח" הוא אחד האתגרים החשובים ביותר בבינה מלאכותית

ככל שמודלי בינה מלאכותית נבנים על מאגרי מידע עצומים, רגישים ולעיתים אישיים, השאלה כבר אינה רק איך מאמנים מודל טוב יותר, אלא איך מוכיחים שהוא מחק מידע כאשר החוק, הלקוח או הארגון דורשים זאת. תחום Machine Unlearning, מחיקת למידה ממודלים, נועד לאפשר למערכת AI "לשכוח" רשומות מסוימות בלי לשלם את העלות האדירה של אימון מלא מחדש.

בפוסט מחקר שפרסמה Google Research, החוקרת מוניקה ריברו מציגה מסגרת ביקורת חדשה בשם Regularized f-Divergence Kernel Tests, שפותחה יחד עם אנטונין שרב וארתור גרטון והוצגה ב-AISTATS 2026. החידוש המרכזי הוא מעבר מבדיקה פשטנית של "האם שני מודלים מתנהגים אותו דבר" לשאלה מדויקת יותר: האם המודל שעבר מחיקה קרוב יותר למודל בטוח שאומן ללא המידע הרגיש, או למודל המקורי שראה את המידע ועלול לזכור אותו.

הבעיה בגישות הבדיקה הקיימות

בדיקות דו-מדגמיות משמשות שנים כדי להשוות בין שתי התפלגויות. במקרה של מחיקת מכונה, בודק חיצוני עשוי להשוות בין פלטים של מודל שאומן מחדש ללא רשומה מסוימת לבין מודל שטוען כי "שכח" אותה. אם ההתפלגויות שונות, ניתן להסיק לכאורה שהמחיקה נכשלה.

אבל במודלים מודרניים זו הנחה מסוכנת. שני מודלים שאומנו על אותם נתונים בדיוק יכולים להפיק התפלגויות שונות בגלל גודל אצווה, אתחול אקראי או פרטי אימון אחרים. כלומר, בדיקה סטנדרטית עלולה לסמן ככשל גם מודל בטוח לחלוטין. מנגד, כלים נפוצים כמו Maximum Mean Discrepancy טובים בזיהוי שינוי גלובלי רחב, אך עלולים לפספס דליפה נקודתית, למשל פלט חריג שמופיע רק בעקבות ניסוח שאילתה ספציפי מאוד.

מה גוגל משנה בפועל

המסגרת החדשה משתמשת במשפחת מדדים סטטיסטיים הנקראת f-Divergence, שמאפשרת למדוד סוגים שונים של פערים בין התפלגויות. מדדים כמו KL divergence ו-Chi-squared divergence יכולים להיות רגישים לשינויים מקומיים וחלקים, בעוד Hockey-stick divergence מתאים במיוחד להקשרים של פרטיות דיפרנציאלית, משום שהוא מאפשר להגדיר תקציב בטיחות ולהתעלם מהבדלים זניחים שאינם מהווים הפרת פרטיות ממשית.

הערך המעשי כאן הוא לא רק מתמטי. המסגרת משתמשת ברגולריזציה מבוססת גרעינים כדי להפוך את החישוב לישים גם בנתונים עתירי ממדים, ומוסיפה מנגנון אדפטיבי שבוחר את המדד והפרמטרים המתאימים לבדיקה. בכך היא מצמצמת את הצורך בכוונון ידני, אחד החסמים הגדולים בהפיכת ביקורת AI מתיאוריה לכלי עבודה תפעולי.

ההשלכות לתעשייה ולרגולציה

מנקודת מבט עסקית, זהו צעד חשוב בדרך לשוק שבו ספקי AI לא רק מבטיחים ציות ל-GDPR או למדיניות מחיקת נתונים, אלא מספקים ראיות סטטיסטיות לכך. ארגונים בתחומי פיננסים, בריאות, ביטוח וסייבר עשויים להזדקק בעתיד לבדיקות מסוג זה כחלק מתהליכי רכש, ביקורת ספקים וניהול סיכוני מודלים.

בניסויים שתוארו במחקר, המסגרת הצליחה לזהות הפרות פרטיות עם פחות דגימות מאשר גישות קודמות, ובמקרים מסוימים גילתה כשלים שבהם כלים קיימים דרשו מיליוני דגימות. בתחום מחיקת המכונה, התוצאה משמעותית במיוחד: שיטות כמו Fine-tuning, גיזום ו-Selective Synaptic Dampening לא הצליחו להוכיח שכחה מספקת בהגדרות שנבדקו, בעוד שגישה מבוססת תוויות אקראיות עברה את הבדיקה היחסית.

לא פתרון קסם, אבל שינוי כיוון

המסר הרחב ברור: מחיקת מידע ממודלים אינה יכולה להימדד רק לפי דמיון שטחי בין פלטים. נדרש סטנדרט ביקורת שמבין את ההבדל בין רעש אימון תמים לבין זיכרון מסוכן של מידע רגיש. אם המסגרת של גוגל תבשיל לכלי קוד פתוח או לשירות ביקורת מסחרי, היא עשויה להפוך לאבן יסוד באקו-סיסטם של AI אחראי, בדומה למה שכלי אבטחת מידע עשו לעולם התוכנה הארגונית.

כך מוכיחים שמודל AI באמת שכח מידע

למה "לשכוח" הוא אחד האתגרים החשובים ביותר בבינה מלאכותית

רוצה להישאר מעודכן ב-AI?

הבעיה בגישות הבדיקה הקיימות

מה גוגל משנה בפועל

ההשלכות לתעשייה ולרגולציה

לא פתרון קסם, אבל שינוי כיוון

שאלות נפוצות