חזרה לחדשות
WRING מציעה דרך חכמה להפחתת הטיות במודלי ראייה

WRING מציעה דרך חכמה להפחתת הטיות במודלי ראייה

30 באפריל 2026
מערכת זירת AI

לפי פרסומים אחרונים, חוקרים מ MIT, WPI וגוגל מציגים את WRING, שיטה יעילה לעמעום הטיות במודלי ראייה ושפה כמו CLIP, תוך הימנעות מ"משחק החפרפרת" שבו תיקון הטיה אחת מחזק אחרות.

חוקרים ממכון הטכנולוגי של מסצ'וסטס (MIT), המכון הפוליטכני של ווסטר (WPI) וגוגל, מציעים פתרון חדש לבעיה עיקשת בבינה מלאכותית: איך מפחיתים הטיות במודלים חזותיים מבלי "לשבור" את שאר הידע שהמודל למד ובנוסףמבלי להעצים הטיות אחרות.

למה הטיות במודלי ראייה הן בעיית בטיחות ולא רק עניין סטטיסטי

במערכות רפואיות דוגמת דרמטולוגיה ממוחשבת, מודל AI שמסווג נגעי עור עשוי לסייע בזיהוי מוקדם של סרטן. אך אם המודל מוטה לגווני עור מסוימים או לדפוסים חזותיים שמופיעים יותר בנתוני האימון, הוא עלול לפספס מטופלים בסיכון גבוה. זו בדיוק הסיבה שב MIT מתייחסים להטיה כאל סוגיית בטיחות, במיוחד כאשר המודלים משולבים בהחלטות קליניות.

רוצה להישאר מעודכן ב-AI?

הירשם לדיוור השבועי שלנו וקבל עדכונים, המלצות על כלים, חדשות ודוחות מיוחדים

האיומים אינם מוגבלים לנתונים בלבד. גם אם מאגר התמונות מאוזן יחסית, עצם האופן שבו המודל מארגן את הידע שלו במרחב הייצוגים (Embeddings) עלול לשמר הטיות ולשכפל אותן בעקיפין. במודלים רב מודאליים, שמקשרים בין תמונה לטקסט, ההשלכות עלולות להתבטא בתוצאות חיפוש, בסיווגים, ובהמלצות שמשפיעות על אנשים אמיתיים.

"דילמת החפרפרת": כשמתקנים הטיה אחת ומייצרים אחרת

הגישה הנפוצה כיום להפחתת הטיות במודלים כמו CLIP נקראת "Debiased Projection" או "הטיה באמצעות הטלה". בפשטות, היא מנסה להסיר מהייצוגים את הכיוון המתמטי שבו "יושבת" ההטיה. אבל כאן מתגלה מה שמכונה בעולם המחקר "דילמת החפרפרת": ברגע שמוחקים ממד אחד של הטיה, היחסים האחרים במודל משתנים, ולעיתים הטיות חדשות מתחזקות.

כפי שמסביר וולטר גרייך, המחבר הראשון של המאמר שפורסם בנושא, הסרה כזו "מכווצת" את המרחב כולו ובכך משנה גם קשרים שאינם קשורים ישירות להטיה שניסו לטפל בה. בהסבר נוסף שממחיש היבט מעשי: אם מפחיתים הטיה גזעית בעת אחזור תמונות של צוות רפואי, ייתכן שבלא כוונה יוגברו הטיות מגדריות.

WRING: סיבוב במקום מחיקה

החידוש במחקר הוא טכניקה בשם Weighted Rotational DebiasING, או בקיצור WRING. במקום "לחתוך" החוצה מידע בעייתי, החוקרים מסובבים רכיבים מסוימים במרחב הרב ממדי של הייצוגים לזווית אחרת. התוצאה היא שהמודל מתקשה להבחין בין קבוצות בתוך מושג מסוים (למשל, מאפיינים שמובילים להטיה), אך שומר על שאר היחסים שנלמדו.

חשוב לא פחות: WRING היא שיטת Post-Processing. כלומר, אפשר להפעיל אותה על מודל שכבר אומן בלי לאמן מחדש מודלים ענקיים ויקרים. בהקשר תעשייתי, זה יתרון משמעותי, כי ארגונים רבים נשענים על מודלים מאומנים מראש לצרכי חיפוש, ניטור איכות, סינון תוכן וכלים קליניים.

מה מצאו החוקרים ומה השלב הבא

על פי התוצאות, WRING הצליחה להפחית הטיה במושג מטרה בלי להגדיל הטיות בממדים אחרים, ובכך להתמודד טוב יותר עם "משחק החפרפרת". בשלב זה, הגישה מיועדת בעיקר למודלי CLIP, אך גרייך מציין שהרחבה למודלים גנרטיביים בסגנון ChatGPT היא יעד טבעי להמשך.

במבט רחב, WRING משתלב במגמה עולמית לייצר AI אמין יותר, שניתן לפריסה מהירה, ושלא "משלם" מחיר בטיחותי בכל ניסיון לתקן חוסר הוגנות. עבור תחומי הרפואה, החינוך והשירותים הציבוריים, זו עשויה להיות אבן דרך בדרך למודלים שמשרתים אוכלוסיות מגוונות בצורה עקבית יותר.

שאלות נפוצות