
קרדיט תמונה: Google Research
מחקר גוגל: ג'מיני לומד לזהות התפרצויות כוכבים מכמה דוגמאות בודדות
לפי הבלוג של Google Research, מודל Gemini הותאם כסייען אסטרונומי שמסווג אירועים חולפים בשמיים בדיוק של כ-93% בשלושה סקרים שונים, לאחר לימוד מ-15 דוגמאות מסומנות לכל סקר בלבד, ומספק הסברים טקסטואליים וניקוד עדיפות להמשך תצפית.
כפי שפורסם בבלוג של גוגל.
לפי דיווח ב Google Research Blog. רעיון מרכזי שעולה מהפרסום: מודל Gemini הרב-מודלי הוסב ב-few-shot ל"עוזר אסטרונומי" שמזהה ומסביר אירועים חולפים כמו סופרנובות בדיוק גבוה, תוך שקיפות נימוקים. מחקר של גוגל מעלה כי שימוש ב-15 דוגמאות מסומנות לכל סקר הספיק כדי להגיע לביצועים ברמת מודלים ייעודיים, על פי הבלוג של גוגל.
המחקר, מאת Turan Bulmus ו-Dr. Fiorenzo Stoppa ושהתפרסם ב-Nature Astronomy, בחן שלושה סקרים אסטרונומיים שונים: Pan-STARRS, MeerLICHT ו-ATLAS. בכל דוגמה הוצגו למודל שלוש תמונות קטנות: תמונת התראה חדשה, תמונת ייחוס, ותמונת הפרש שמדגישה את השינוי. ג'מיני התבקש להחזיר לא רק תגית "אמיתי" או "בוגוס", אלא גם הסבר טקסטואלי תואם-תמונה וניקוד עניין לפעילות המשך. התוצאה: דיוק ממוצע של כ-93% על פני שלושת המאגרים, בדומה ל-CNNs ייעודיים שדורשים אימון ארוך ועל הרבה יותר נתונים.
נוסף על כך, החוקרים הראו מנגנון אמינות פנימי: ג'מיני דירג את הקוהרנטיות של ההסבר שלו עצמו בסולם 0 עד 5. דירוג קוהרנטיות נמוך ניבא היטב טעויות סיווג, מה שמאפשר זרימת עבודה human-in-the-loop יעילה שממקדת אסטרונומים רק במקרים הלא-ודאיים. פאנל של 12 אסטרונומים העניק ציוני קוהרנטיות גבוהים לרוב ההסברים, והראה התאמה בין הנימוק לניקוד העניין. באמצעות הוספת דוגמאות קשות בחזרה לפרומפט, הדיוק ב-MeerLICHT השתפר מכ-93.4% לכ-96.7%.
למה זה חשוב? סקרים מהדור הבא, כמו מצפה ורה רובין, צפויים לייצר עד 10 מיליון התראות ללילה. פתרונות "שחורות קופסה" מקשים על תעדוף ואמון. כאן מתקבלת גם שקיפות וגם יכולת הערכת אי-ודאות, המתורגמות לקיצור זמן מיון, הפחתת עומס ידני ושיפור גילוי סופרנובות אמיתיות. מבחינה טכנית, זו הדגמה חזקה של few-shot prompting רב-מודלי: למידה מהוראות קצרות ודוגמאות מעטות, הכללה בין סקרים עם סקלות פיקסל שונות, ושילוב הערכת אמינות עצמית הדומה עקרונית לכיול מודלים.
מעבר לאסטרונומיה, הגישה מתאימה לתחומים מדעיים נוספים בעלי נתוני תמונה מורכבים, כמו פתולוגיה דיגיטלית, חישה מרחוק וזיהוי חריגים. עם זאת, הצלחתה תלויה באיכות הדוגמאות ובבקרת הטיות. מומלץ למכונים לבנות ספריות פרומפטים ניתנות לעדכון, לשלב בדיקות עקביות הסבר-תוצאה, ולהעריך עמידות בשינויים תצפיתיים.
בפרסום מודים גם לשותפים: Steven Bloemen, Stephen J. Smartt, Paul J. Groot, Paul Vreeswijk ו-Ken W. Smith. הממצאים מרחיבים את הידוע לגבי שימוש ב-LLMs רב-מודליים במדע נתוני-גדולים, ומציעים נתיב לסייענים "סוכניים" שמבקשים תצפיות המשך ומקדמים תגליות בזמן אמת.
