
קרדיט תמונה: Zirat AI
מנהל Google Cloud מגדיר מחדש את משוואת המודלים: שלושה גבולות של יכולת
מייקל גרסטנהבר, סמנכ״ל מוצר ב־Google Cloud, מציע מסגרת חשיבה חדשה להערכת מודלי AI ארגוניים: במקום להתמקד רק באינטליגנציה גולמית, חברות צריכות לבחון גם זמני תגובה ויכולת הרחבה כלכלית. הגישה מסבירה מדוע אימוץ מערכות אוטונומיות עדיין איטי, ומה נדרש כדי לשנות זאת.
בעוד רוב השיח הציבורי סביב מודלי שפה גדולים נסוב סביב מירוץ לאינטליגנציה גולמית, מייקל גרסטנהבר מ־Google Cloud מציע דרך חשיבה שונה. במקום ציר יכולת יחיד, הוא רואה שלושה גבולות נפרדים שעל חברות להתייחס אליהם, כפי שעולה מראיון שפורסם היום ב־TechCrunch.
גרסטנהבר, שמנהל את Vertex AI, הפלטפורמה הארגונית של Google לפריסת מודלי AI, מחלק את שוק המודלים לשלוש קטגוריות, והראשונה שבהן היא אינטליגנציה טהורה- מקרים בהם איכות הפלט היא הפרמטר היחיד שחשוב, גם אם התשובה לוקחת 45 דקות. דוגמה שממחישה את הקטגוריה בצורה ברורה היא פיתוח תוכנה, כאשר קוד איכותי חשוב יותר מתשובה מהירה. הקטגוריה השניה היא זמן תגובה- בעולם תמיכה בלקוחות או במוקדי שירות, דיוק התשובה משנה פחות אם הלקוח כבר ניתק. במקרים הללו החברות צריכות למצוא את המודל החכם ביותר שעדיין עומד באילוץ הזמן, "לא משנה כמה אתה צודק אם לקח 45 דקות להשיג את התשובה" טוען גרסטנהבר.
הקטגוריה השלישית היא המעניינת ביותר: יכולת הרחבה בעלות נמוכה. פלטפורמות כמו Reddit או Meta שרוצות למתן תוכן באינטרנט לא יכולות לצפות את עומסי העבודה מראש ולכן נחוץ מודל שניתן להרחיב אותו לסקלה בלתי צפויה, גם במחיר של פחות אינטליגנציה, "הן צריכות להגביל את עצמן למודל באינטליגנציה הגבוהה ביותר שהן יכולות להרשות לעצמן, אבל בצורה שניתנת להרחבה למספר אינסופי של נושאים", הוא אומר.
המסגרת הזו חשובה במיוחד לחברות ישראליות שמתכננות אסטרטגיית AI ארגונית. במקום לרדוף אחרי המודל "החזק ביותר" בשוק, כדאי להתאים את בחירת המודל לתרחיש השימוש הספציפי ולאילוצים העסקיים.
מדוע המהפך האוטונומי עדיין לא הגיע
גרסטנהבר מציע גם הסבר למה אימוץ מערכות אוטונומיות איטי יותר מהצפוי, "הטכנולוגיה בת שנתיים בלבד, ועדיין חסרה הרבה תשתית. אין לנו דפוסים לביקורת על פעולות הסוכנים. אין לנו דפוסים להרשאות גישה למידע. אלה דפוסים שידרשו עבודה כדי להכניס אותם לייצור".
פיתוח תכנה הוא החריג מביניהם, שם האימוץ התקדם מהר יותר, והסיבה היא שתהליכי העבודה הקיימים כבר כוללים בדיקות רב-שלביות ושמירה על איכות. ב־Google, למשל, כל קוד דורש אישור של שני מפתחים לפני שהוא מגיע לייצור. "יש לנו הרבה תהליכים מסוג Human-in-the-loop שהופכים את היישום לבעל סיכון נמוך במיוחד, אבל אנחנו צריכים לייצר את הדפוסים האלה במקומות אחרים ובמקצועות אחרים".
עבור מנהלים ישראלים, המסר ברור: ההשקעה בתשתיות ניהול, ביקורת והרשאות היא לא פחות קריטית מבחירת המודל עצמו. חברות שירצו לנצל את הפוטנציאל של כלי AI אוטונומי יצטרכו לבנות מסגרות ממשל ובקרה מתאימות.
האינטגרציה האנכית כיתרון תחרותי
גרסטנהבר, שעבד ב־Anthropic לפני שהצטרף ל־Google לפני כחצי שנה, רואה באינטגרציה האנכית של Google יתרון משמעותי. "Google ייחודית בכך שיש לנו הכל מהממשק ועד שכבת התשתית. אנחנו יכולים לבנות מרכזי נתונים. אנחנו יכולים לקנות חשמל ולבנות תחנות כוח. יש לנו צ'יפים משלנו. יש לנו מודל משלנו. אנחנו שולטים בשכבת ה־Inference".
עבור מפתחים ישראלים שעובדים עם Vertex AI, המשמעות היא גישה לסטאק טכנולוגי שלם מספק אחד, עם יכולות שמשתרעות מבניית אפליקציות ועד אופטימיזציה של עלויות תשתית. השאלה שעולה היא האם האינטגרציה הזו מתורגמת ליתרון מעשי או להפך, יוצרת תלות בספק יחיד?
