
קרדיט תמונה: Zirat AI / AI
מחקר MIT: להבין את הדקויות של אינטליגנציה דמויית-אדם
לפי דיווח ב MIT News, פרופ' פיליפ איזולה (EECS, CSAIL) מציע מבט מחודש על איך מודלים לומדים לייצג את העולם, ומעלה את 'השערת הייצוג האפלטוני' שלפיה מערכות שונות מתכנסות לייצוג משותף של מציאות אחת. המטרה: שילוב בטוח ואפקטיבי של בינה מלאכותית בחברה
לפי אתר חדשות של אוניברסיטת MIT, המחקר של פרופ' פיליפ איזולה, שקיבל קביעות לאחרונה במחלקה להנדסת חשמל ומדעי המחשב (EECS) וחבר CSAIL, מבקש לפענח מהו המשותף לכל סוגי האינטליגנציה — אנושית, חייתית ומלאכותית. רעיון מרכזי שעולה מהפרסום: מודלים שונים, משפה דרך ראייה ועד שמע, מגלים דמיון מבני כשהם גדלים ומקבלים יותר נתונים. מחקר של MIT מעלה כי ייתכן שהם מתכנסים לייצוג פנימי דומה של העולם.
איזולה ועמיתיו מציגים את "השערת הייצוג האפלטוני": בדומה לצללים על קיר במשל המערה של אפלטון, מקורות מידע שונים משקפים מציאות סיבתית אחת. לפיכך, מודלים גדולים מאומנים על טקסט, תמונה ושמע עשויים להתכנס לאותה "מפת עולם" סמויה. התזה הזו משתלבת במגמות עדכניות כמו CLIP ומודלים מולטימודליים, שמראים מרחב סמנטי משותף לר modalities שונות, ומחזקת את הכיוון של מחקרי world models ב-AI.
ציר משלים בעבודתו הוא למידה עצמית-מונחית: היכולת של מודלים לקבץ פיקסלים אוטומטית, לנבא חלקים חסרים או להבין יחסים בלי תוויות. היתרון מעשי גדול בתחומים שבהם תיוג יקר או נדיר — דימות רפואי, רובוטיקה, וכלי רכב אוטונומיים. איזולה מדגיש כי ייצוג טוב של העולם הוא מנוע לפתרון בעיות downstream. גישות כמו contrastive learning ו-MAE כבר הראו שקפיצות ביצועים מתקבלות גם בלי תיוג מסיבי.
מעבר לתיאוריה, איזולה ידוע בהישגיו המוקדמים בתרגום תמונה-לתמונה ובהובלת מערכות גנרטיביות. הוא למד קוגניציה בייל אצל פרופ' בריאן שול, כתב דוקטורט ב-MIT בהנחיית פרופ' טד אדלסון על קיבוץ תפיסתי, עשה פוסט-דוקטורט בברקלי, ואף שהה שנה ב-OpenAI כדי להעמיק בחיזוק. הייחוד בעבודתו: שילוב חתירה לעקרונות יסוד עם רגישות לאבני-בוחן הנדסיות, בלי להיכנע ל"מירוץ הבנצ'מרקים".
בזירה הציבורית, איזולה מעריך כי AGI אינו רחוק, אך מדגיש עתיד של קו-אקזיסטנס: מכונות חכמות לצד בני אדם השומרים על סוכנות ושליטה. זהו מסר חשוב בעידן הייפ ה-AI: הקורס 6.7960 (למידה עמוקה) שהוא מוביל יחד עם סגל נוסף זינק מ-30 ליותר מ-700 סטודנטים בארבע שנים, אך הסטודנטים מתבקשים לשמור ספקנות מדעית — קצב ההתקדמות מהיר והנחות עלולות להשתנות.
מדובר במחקר מעניין לאור המציאות שבה AI חוצה תחומים ומודלים מולטימודליים נהיים הנורמה. ממצאי איזולה מסקרנים: אם ייצוגים מתכנסים, ייתכן שנוכל לתכנן מערכות יעילות יותר, עם העברת ידע בין תחומים ושיפור בבטיחות ובאוֹמנוּת. המחקר מרחיב את מה שידענו על למידה עצמית, ומספק מסגרת תיאורטית מאחדת להבנת "איך מכונות חושבות" — דרך החלון של ייצוגי העולם שלהן.
