חזרה לחדשות
איך תורת המשחקים והיכולת לבלף מקדמות בינה מלאכותית אסטרטגית

איך תורת המשחקים והיכולת לבלף מקדמות בינה מלאכותית אסטרטגית

12 במאי 2026
מערכת זירת AI
מקור:זירת AI

פרופ׳ גבריאלה פארינה חוקר כיצד תורת המשחקים, אופטימיזציה ולמידת מכונה מאפשרות למערכות AI לקבל החלטות יציבות במצבי אי ודאות ומידע חלקי, כולל פריצת דרך במשחק Stratego בעלות אימון נמוכה.

הבינה המלאכותית של העשור האחרון לא מסתפקת יותר בזיהוי תמונות או בהשלמת משפטים. האתגר הבא הוא היגיון אסטרטגי: היכולת לקבל החלטות כשיש כמה שחקנים, לכל אחד מטרות שונות, וחלק מהמידע מוסתר. זהו בדיוק תחום המחקר של Gabriele Farina (גבריאלה פארינה), עוזר פרופסור ב־MIT במחלקה להנדסת חשמל ומדעי המחשב (EECS) וחוקר מוביל ב־LIDS.

מה הופך החלטות בעולם האמיתי לכל כך קשות

פארינה משלב תורת המשחקים עם כלים מודרניים כמו למידת מכונה, אופטימיזציה וסטטיסטיקה כדי להבין איך מערכות מרובות סוכנים יכולות להגיע ל"שיווי משקל" כלומר מצב יציב שבו לאף שחקן אין תמריץ לשנות אסטרטגיה. בעולם האקדמי זה נשמע תיאורטי, אבל בפועל מדובר בשפה המתמטית שמאחורי שווקים פיננסיים, מכרזים דיגיטליים, תחרות בין חברות, ניהול תשתיות ענן, וגם אינטראקציות בין בני אדם למערכות AI.

רוצה להישאר מעודכן ב-AI?

הירשם לדיוור השבועי שלנו וקבל עדכונים, המלצות על כלים, חדשות ודוחות מיוחדים

הבעיה היא שבמערכות מציאותיות מרובות שחקנים, מספר האפשרויות גדל במהירות עצומה. פארינה מדגיש שמציאת שיווי משקל במשחקים מורכבים יכולה להיות חישובית כל כך כבדה, עד שחישוב נאיבי עלול להימשך זמן דמיוני. לכן המטרה של קבוצתו היא לפתח אלגוריתמים שמוצאים נקודות יציבות ביעילות, גם כשמרחב הפעולות עצום.

"מידע לא מושלם" והערך של סודיות

מרכז הכובד בעבודתו של פארינה הוא תרחישים של מידע לא מושלם: מצבים שבהם לשחקנים שונים יש מידע שאחרים לא יודעים. במצבים כאלה, מידע הוא נכס, ושחקנים חייבים להיות אסטרטגיים לא רק לגבי מה לעשות, אלא גם לגבי מה לחשוף. דוגמה יומיומית היא פוקר: היכולת לבלף אינה קישוט, אלא מנגנון שמגן על ערך המידע.

כאן נכנסת תובנה שמטלטלת לא מעט תפיסות: לפי פארינה, "אנחנו חיים בעולם שבו מכונות טובות יותר מבני אדם בלבלף". המשמעות אינה רק משחקים, אלא גם משא ומתן, תמחור דינמי, תכנון לוגיסטי ותיאום בין מערכות אוטונומיות, תחומים שבהם הסתרה, איתות והערכת כוונות הן חלק מהמשחק.

הדגמה של AI שמבין תמריצים

לפני שהצטרף לסגל MIT, פארינה עבד כחוקר במטא והיה מעורב בפיתוח Cicero, מערכת AI שהצליחה לנצח בני אדם במשחק שמחייב בריתות, משא ומתן וזיהוי בלופים. לפי התיאור שלו, המערכת תוכננה כך שלא תסכים לברית אם זה לא משרת את האינטרס שלה, ותזהה שחקנים שסביר שהם משקרים, משום שהצעה שלהם אינה עקבית עם התמריצים שלהם.

Stratego כמבחן קיצון, והניצחון בעלות נמוכה

החיבור בין תיאוריה ליישום חוזר גם למחקר על Stratego, משחק אסטרטגיה צבאי עתיר הטעיות וחישובי סיכון, שנחשב במשך שנים לאחד המשחקים הקלאסיים הקשים ביותר להשגת ביצועים על־אנושיים בו. לפי MIT, מאמצי מחקר קודמים עלו מיליוני דולרים, אך פארינה וצוותו הצליחו לפתח אלגוריתמים ואימון בעלות של פחות מ־10,000 דולר ולנצח את מי שמתואר כ"השחקן הטוב בכל הזמנים" בתוצאה מרשימה של 15 ניצחונות, ארבע תוצאות תיקו והפסד אחד.

למה זה חשוב לתעשייה עכשיו

הערך של מחקר מסוג זה הוא בהפיכת "אסטרטגיה" ליכולת חישובית ניתנת להטמעה: מערכות שמבינות תמריצים, מתמודדות עם מידע חלקי, ומגיעות להחלטות יציבות בקנה מידה גדול. עם כניסת סוכני AI לעולמות כמו מסחר, שירות לקוחות, תפעול ענן ואבטחת סייבר, היכולת לחזות תגובות של צדדים אחרים ולתכנן בהתאם הופכת מנחמד לדעת לתנאי בסיס. במובן הזה, הכלים שפארינה מפתח מסמנים כיוון שבו AI אינה רק מחוללת טקסט או מזהה דפוסים, אלא מתנהלת כשחקן רציונלי בזירה רבת משתתפים.

שאלות נפוצות