
אופטימיזציה לסוכני AI: כך חקר ביצועים יכול לצמצם עלויות ולהגדיל ROI בארגונים
מאמר חדש של דסטין גונג ב-Towards Data Science מציג כיצד מודלים קלאסיים של חקר ביצועים יכולים לפתור את אחת הבעיות הבוערות באימוץ סוכני AI: שליטה בעלויות, תכנון משאבים והקצאה חכמה של סוכנים למשימות עסקיות.
ארגונים המאמצים סוכני AI ומערכות מרובות סוכנים נדרשים להתמודד עם אתגר חדש: כיצד לתכנן, להקצות ולנתב סוכנים בצורה שממקסמת ערך עסקי מבלי לגרום לעלויות תפעול, שימוש במודלי שפה וטוקנים לצאת משליטה.
במאמר שפרסם דסטים גונג (Destin Gong), מוצגת גישה פרקטית המחברת בין עולם סוכני הבינה המלאכותית לבין חקר ביצועים, תחום מתמטי ותיק המשמש לקבלת החלטות מיטבית תחת אילוצים. הרעיון המרכזי פשוט אך משמעותי: במקום לבחור סוכנים, תקציבים וזרימות עבודה לפי אינטואיציה, ניתן לתרגם את הבעיה העסקית למודל אופטימיזציה עם משתני החלטה, אילוצים ופונקציית מטרה.
רוצה להישאר מעודכן ב-AI?
הירשם לדיוור השבועי שלנו וקבל עדכונים, המלצות על כלים, חדשות ודוחות מיוחדים
סוכני AI כבעיה מתמטית עסקית
סוכני AI הפכו בשנים האחרונות משכבת ניסוי למרכיב תפעולי בארגונים. הם משמשים לתמיכת לקוחות, ניתוח נתונים, אוטומציה, כתיבת תוכן, ניהול ידע, ניטור תהליכים ופיתוח תוכנה. אך ככל שמספר הסוכנים גדל, כך גדלה גם המורכבות הניהולית: איזה סוכן צריך להיבנות, מי מתאים לאיזה פרויקט, אילו סוכנים משתלמים בתוך תקציב מוגבל, וכיצד לנתב אלפי בקשות בין מחלקות, רכזות וסוכנים.
גונג מציע להשתמש בארבעה דפוסי אופטימיזציה מוכרים: כיסוי קבוצות, השמה, תרמיל וזרימת רשת. כל אחד מהם מתאר סוג אחר של החלטה ארגונית. במודל כיסוי קבוצות, המטרה היא לבחור את מספר הסוכנים המינימלי שיכסה את כל הכישורים הנדרשים בארגון. בדוגמה שבמאמר, בחירה אופטימלית של ארבעה סוכנים בלבד מכסה את כל תחומי היכולת הנדרשים בעלות של 80 אלף דולר, לעומת עלות ממוצעת גבוהה בהרבה בבחירות אקראיות.
יותר תפוקה באותו תקציב
מודל ההשמה מתמקד בהתאמת סוכנים לפרויקטים. במקום להקצות סוכן לפרויקט לפי זמינות בלבד, המודל בוחן את התרומה הצפויה של כל סוכן לכל פרויקט ומחשב את ההקצאה שמייצרת את הערך הכולל הגבוה ביותר. בסימולציה שהוצגה, ההקצאה האופטימלית השיגה ציון התאמה של 77, לעומת ממוצע של 63.16 בהקצאות אקראיות, שיפור של כ-21.9%.
מודל התרמיל מתאים במיוחד לתכנון תקציב. כאשר לארגון יש מגבלת הוצאה חודשית, למשל 4,000 דולר, ניתן לבחור את סל הסוכנים שמפיק את מספר הטוקנים הגבוה ביותר במסגרת התקציב. לפי הדוגמה, המודל בחר ארבעה סוכנים שהפיקו יחד 215 מיליון טוקנים, שיפור של כ-41.8% לעומת בחירות אקראיות ממוצעות.
ניתוב בקשות במערכות מרובות סוכנים
המודל הרביעי, בעיית רשת, עוסק בתכנון זרימת בקשות בין סוכנים, רכזות ומחלקות בארגון. זהו תחום חשוב במיוחד במערכות agentic AI, שבהן משימות עוברות בין כמה כלים וסוכנים לפני שהן נפתרות. המאמר מדגים כיצד ניתן לנתב 12 אלף בקשות חודשיות ממערך של סוכני קוד וכתיבה אל מחלקות שיווק, IT ותפעול, תוך עמידה במגבלות קיבולת של כל קישור. התוצאה האופטימלית הפחיתה את העלות החודשית לכ-5,630 דולר, חיסכון ממוצע של כ-33% לעומת פתרונות אקראיים אפשריים.
המשמעות לארגונים
התרומה המרכזית של המאמר היא בהדגמה שסוכני AI אינם רק אתגר של הנדסת פרומפטים או בחירת מודל שפה. הם גם בעיית אופטימיזציה ארגונית. ככל שמערכות מרובות סוכנים יהפכו לחלק מהתשתית העסקית, ארגונים יצטרכו למדוד עלויות, קיבולת, ערך ותפוקה באותה רמת רצינות שבה הם מנהלים שרשרת אספקה או כוח אדם.
הדוגמאות במאמר נבנו באמצעות ספריית Gurobi בפייתון, מנוע אופטימיזציה ארגוני התומך בתכנות ליניארי ובתכנות בשלמים מעורבים. עם זאת, המסר רחב יותר מהכלי עצמו: כאשר מתרגמים תכנון סוכני AI למודל מתמטי, ניתן לקבל החלטות שקופות, מדידות ויעילות יותר. עבור מנהלי טכנולוגיה, מדעני נתונים וצוותי AI, זו עשויה להיות אחת הדרכים החשובות להפוך מערכות סוכנים מניסוי יקר למנוע עסקי מנוהל.
