מודל AI חדש של MIT שמבין גרפים טוב יותר

מודל AI חדש של MIT שמבין גרפים טוב יותר

3 ביוני 2026
מערכת זירת AI
מקור:זירת AI

חוקרים מ-MIT פיתחו מאגר נתונים בשם ChartNet הכולל מעל מיליון תרשימים סינתטיים, ומאפשר לאמן מודלי VLM קטנים לפרש גרפים ותרשימים בדיוק העולה על מודלים מסחריים גדולים בהרבה. הפריצה הזו עשויה לשנות את האופן שבו חברות קטנות ובינוניות, כולל ישראליות, משתמשות ב-AI לניתוח נתונים עסקיים.

כשמודל קטן מכה את המודל הגדול: פריצת דרך בהבנת גרפים

אחת הבעיות המעשיות שחברות נתקלות בהן בעת הטמעת מודלי AI לניתוח עסקי היא פשוטה לכאורה: המודלים אינם קוראים גרפים בצורה אמינה. דוחות פיננסיים, סקירות שוק, ותרשימי ביצועים - כל אלה דורשים מהמודל לשלב בו-זמנית הבנה חזותית, מספרית ולשונית. גם מודלים מסחריים מהשורה הראשונה מתקשים עם המשימה.

רוצה להישאר מעודכן ב-AI?

הירשם לדיוור השבועי שלנו וקבל עדכונים, המלצות על כלים, חדשות ודוחות מיוחדים

כעת, חוקרים מ-MIT ומ-MIT-IBM Computing Research Lab פיתחו פתרון: מאגר אימון ייעודי בשם ChartNet, שמכיל מעל מיליון תרשימים מגוונים שנוצרו באופן סינתטי. המחקר יוצג בכנס IEEE Computer Vision and Pattern Recognition.

הבעיה: מחסור בנתוני אימון איכותיים

מאגרי הנתונים הקיימים לאימון מודלי VLM (Vision-Language Models) בתחום פרשנות גרפים סובלים ממספר מגבלות מבניות: הם מכילים מספר מצומצם של תרשימים שנשאבו מהאינטרנט, חסרים בהם שכבות מידע נוספות שמאפשרות למודל להבין את הנתונים שמאחורי הגרף, ולרוב מתמקדים רק במענה על שאלות פשוטות.

"מודל VLM, בניגוד למוח האנושי, עשוי להזדקק לאלפי דוגמאות בשלב האימון כדי לזהות בצורה אמינה תרשים קו", מסבירה יובנה קונדיץ', סטודנטית לתואר שלישי במחלקה להנדסת חשמל ומדעי המחשב ב-MIT ומובילת המחקר.

הפתרון: נתונים סינתטיים בקנה מידה של מיליון

הצוות פיתח צינור ייצור נתונים דו-שלבי. בשלב הראשון, מערכת אוטומטית ממירה תרשימים קיימים לקוד. בשלב השני, הקוד עובר תהליך איטרטיבי של שינויים - סוג התרשים, ערכי הנתונים, הנושא, הצבעים ועוד.

"אנחנו יכולים להתחיל מתרשים בודד שמשמש כ-seed וליצור ממנו מאות גרסאות שונות. כך הצלחנו לבנות מאגר נתונים של מעל מיליון תמונות מגוונות", מסבירה קונדיץ'.

מעבר לתמונות, כל רשומה במאגר כוללת את הקוד שיצר את התרשים, תיאור טקסטואלי, טבלה עם הנתונים המספריים, וזוגות שאלה-תשובה שמלמדים את המודל כיצד לענות נכון על שאלות לגבי הגרף. נוסף על כך, חלק מהנתונים עבר אנוטציה על ידי מומחים אנושיים, המספק ערבויות אמינות נוספות.

תוצאות: מודלים קטנים גוברים על מודלים מסחריים

החוקרים אימנו את סדרת המודלים Granite Vision של IBM, לצד מודלי קוד-פתוח נוספים בגדלים שונים. התוצאות מראות שיפור משמעותי בכל ארבעת המשימות שנבחנו: שחזור תרשים, חילוץ נתונים, סיכום ומענה על שאלות.

הממצא הבולט ביותר: מודלים קטנים שאומנו על ChartNet הצליחו לעקוף מודלים מסחריים גדולים בהרבה. מדובר בפרמטר קריטי מבחינה עסקית - מודלים קטנים זולים יותר להרצה, פחות תלויים בתשתית ענן יקרה, וניתן לפרוס אותם גם בסביבות עם מגבלות פרטיות.

מאגר ChartNet הוא קוד-פתוח, כלומר חברות ישראליות יכולות להשתמש בו ישירות לאימון מודלים מותאמים, מבלי שיידרשו להשקיע בפיתוח תשתית נתונים עצמאית. עבור סטארטאפים ישראלים בתחומי AI ו-FinTech, מדובר בנקודת פתיחה משמעותית.

"ניסינו ללכת מעבר לשאלות פשוטות על תרשים. יצרנו נתונים שתומכים בכל היבטי הבנת הגרף באופן מעמיק", מסכמת קונדיץ'. הצוות מתכנן להמשיך ולהרחיב את המאגר ברמות מורכבות נוספות.

שאלות נפוצות