
כשבינה מלאכותית צריכה לשכוח כדי לגלות פיזיקה חדשה
מחקר חדש מאוניברסיטת פרינסטון ומכון פלאטירון מגלה שטכניקת transfer learning יכולה לצמצם עשרת מונים את עלויות הסימולציה הקוסמולוגית, אך חושפת סכנה נסתרת: אימון מוקדם עלול לגרום לבינה המלאכותית לפרש עדויות לפיזיקה חדשה כתוצאות ממודל ידוע, ובכך להסוות גילויים מדעיים.
האם AI יכול לפספס את חוקי הפיזיקה הבאים?
המודל הקוסמולוגי הסטנדרטי, הידוע בשם Lambda Cold Dark Matter, הוא הכלי המרכזי של האסטרופיזיקאים לתיאור התרחבות היקום, התפלגות הגלקסיות ומבנה החומר בקנה מידה גדול. אך מידת שלמותו של המודל מוטלת בספק. נתונים עדכניים מצביעים על כך שתופעות כמו נויטרינים בעלי מסה, כבידה מתוקנת, ואנרגיה אפלה משתנה עשויות לרמוז על קיומם של חוקי פיזיקה שטרם נוסחו.
רוצה להישאר מעודכן ב-AI?
הירשם לדיוור השבועי שלנו וקבל עדכונים, המלצות על כלים, חדשות ודוחות מיוחדים
בחינת תיאוריות חלופיות אלה דורשת הרצת סימולציות מחשב מורכבות ביותר, המדמות יקומים וירטואליים תחת הנחות פיזיקליות שונות. עלות החישוב של סימולציות כאלה היא עצומה, ולכן חוקרים מחפשים דרכים לייעל את התהליך.
קיצור הדרך שמסתיר מלכודת
מחקר שפורסם ב-Journal of Cosmology and Astroparticle Physics, שנערך על ידי חוקרים מאוניברסיטת פרינסטון ומכון פלאטירון, בחן את השימוש ב-transfer learning כפתרון לצוואר הבקבוק החישובי. הרעיון הבסיסי פשוט: במקום לאמן רשת עצבית מאפס על נתונים יקרים, מאמנים אותה תחילה על סימולציות פשוטות יחסית של המודל הסטנדרטי, ולאחר מכן מסגלים אותה לטפל במודלים מורכבים יותר הכוללים פיזיקה היפותטית.
השיטה הוכיחה עצמה: היא הצליחה להפחית ביותר מפי עשרה את מספר הסימולציות היקרות הנדרשות לאימון. מבחינה מעשית, מדובר בחיסכון דרמטי במשאבי חישוב.
אך הניתוח הסטטיסטי חשף בעיה משמעותית שהחוקרים כינו negative transfer. כאשר רשת עצבית מסתמכת יתר על המידה על הידע שנצבר בשלב האימון המוקדם, היא נוטה לפרש תצפיות חדשות דרך המסגרת המוכרת, גם כשאלה אינן מתאימות לה.
המקרה של הנויטרינים
הדוגמה הבולטת במחקר נוגעת לנויטרינים בעלי מסה. ההשפעות המבניות שנויטרינים כאלה מייצרים בחלל נראות כמעט זהות לדפוסים הנובעים מפרמטר סטנדרטי הנקרא sigma eight, המתאר את מידת התקבצות החומר בחלל. כיוון ששני הפרמטרים השונים מייצרים תוצאות כמעט בלתי ניתנות להבחנה, הרשת העצבית שעברה אימון מוקדם התקשתה להפריד ביניהם, ובמקום לזהות פיזיקה חדשה פרשה את הנתונים כאילו מדובר בוריאציה של הגדלים המוכרים.
הבעיה אינה שגיאת מחשוב אקראית אלא תוצאה ישירה של ניוון פיזיקלי - מצב שבו מנגנונים קוסמיים שונים יוצרים תוצאות נצפות כמעט זהות. ה-AI, שאומן להכיר את הדפוסים של המודל הסטנדרטי, אינו מצליח לזהות שהסיג'נל שלפניו מקורו בפיזיקה שונה לחלוטין.
מה המשמעות עבור מחקר עתידי
המסגרת שפיתחו החוקרים נבדקה עד כה על מודלים של יקומים וירטואליים בלבד. אך ככל שסקרי חלל קוסמולוגיים קרובים, כמו פרויקט Euclid של סוכנות החלל האירופית ומצפה Vera Rubin, יניבו כמויות עצומות של נתונים אסטרונומיים בדיוק גבוה, חשיבות הממצאים הללו רק תגדל.
המשמעות האמיתית של המחקר חורגת מהאסטרופיזיקה: כלי AI שאומנו על נתוני עבר עלולים להיות עיוורים לדפוסים חדשים שאינם מתאימים לנחות האימון. זהו אתגר שרלוונטי לכל תחום שבו מודלים מנסים לזהות חריגות מול רקע מוכר, מאבטחת סייבר ועד גילוי תרופות. ההבנה של נקודות העיוורון הללו היא תנאי הכרחי לשימוש אחראי ב-AI מדעי.
