
משבר עלויות ה-AI: כשהטוקנים הופכים ליקרים מדי
ענקיות התוכנה Microsoft, Meta ו-Amazon מתחילות לצמצם את השימוש ב-AI פנימי לאחר שעלויות הטוקנים זינקו לרמות בלתי נשלטות. תופעת ה-tokenmaxxing, שבה עובדים ממלאים יעדי שימוש פנימיים ללא ערך עסקי אמיתי, מחברת לפרדוקס כלכלי ידוע: ככל שהטכנולוגיה מתייעלת, כך השימוש בה גדל ועלויותיה עולות.
כשה-AI הופך ליקר מדי: משבר הטוקנים בחברות הענק
הבטחה שחזרה על עצמה בחדרי הדירקטוריון לאורך השנתיים האחרונות הייתה פשוטה: AI יחליף עובדים, יגביר פריון ויצמצם עלויות. כעת, מסתמן שהמציאות מורכבת הרבה יותר. Microsoft, Meta ו-Amazon נסוגות בשקט מהוראות שימוש פנימיות ב-AI, לאחר שהעלויות החלו לחרוג מכל תחזית.
רוצה להישאר מעודכן ב-AI?
הירשם לדיוור השבועי שלנו וקבל עדכונים, המלצות על כלים, חדשות ודוחות מיוחדים
חברת Microsoft שוקלת להורות לעובדיה לעבור מ-Claude Code של Anthropic אל Copilot CLI הפנימי שלה. הסיבה הרשמית: העדפת כלים פנימיים. הסיבה האמיתית, לפי מקורות שציטט The Verge: עלות השימוש ב-Claude Code ממשיכה לטפס ככל שיותר עובדים אימצו אותו לשגרת עבודתם.
agentic AI: פי אלף יותר טוקנים
הבעיה אינה רק שכלי ה-AI נעשים פופולריים יותר. הדור הנוכחי של AI אגנטי, כלים המסוגלים לבצע רצפי פעולות מורכבים באופן אוטונומי, צורך כמות טוקנים הגדולה בסדרי גודל מהשאלה הבודדת שאנחנו שולחים ל-LLM. ההערכות מדברות על פי 1,000 במקרי קצה, תלוי במספר הצעדים הנדרשים לביצוע המשימה.
מקרה הקצה של פיטר שטיינברגר, יוצר OpenClaw, ממחיש את הסכנה: לפי נתוני הכתבה שפורסמה ב-Tom's Hardware, הצוות שלו שרף יותר מ-1.3 מיליון דולר בעלויות טוקנים בחודש אחד בלבד.
tokenmaxxing: כשהיעד הופך לנטל
ג'נסן הואנג, מנכ"ל Nvidia, הצהיר בגלוי שמהנדסי החברה צריכים לצרוך טוקנים בשווי חצי ממשכורתם השנתית כדי להיות פרודוקטיביים באמת, ואמר "האם אתם מטורפים?" למנהלים שהרתיעו עובדים משימוש ב-AI. הצהרה זו, יחד עם לחץ תאגידי דומה ב-Amazon ו-Meta, הולידה תופעה שכונתה tokenmaxxing: עובדים שמשתמשים ב-AI לכל דבר ובלא דבר, רק כדי לעמוד ביעדי שימוש פנימיים. ב-Amazon תועדו מקרים שבהם אנשי צוות הודו בשימוש בכלי ה-AI למשימות מיותרות לחלוטין, כדי לנפח ציוני שימוש.
התוצאה: בזבוז עצום של משאבים ללא ערך עסקי מקביל.
ג'ונתן קוזנמקו, חוקר ישראלי באוניברסיטה לכלכה של פראג העוסק במחקר מודלי שפה בקבלת החלטות, מסביר כי מדד של צריכת טוקנים לא רק שאינו מדד טוב, הוא אף מזיק. "פתרונות המשלבים תהליכים דטרמניסטיים עם מודלי AI בצורה מבוקרת יצרכו פחות טוקנים אך יהיו יעילים ומקצועיים יותר עם פחות טעויות ויותר שיעורי הצלחה". לעומת זאת, העברת תהליכי עבודה לסוכני AI אוטונומיים בצורה לא נכונה עלולה לייצר סיכונים מיותרים, תהיה פחות יעילה אך תצרך כמויות אדירות של טוקנים על כל פעולה גם אם אין שום צורך במודל AI".
פרדוקס ג'בונס בגרסת 2026
התמונה הכוללת מזכירה את פרדוקס ג'בונס הידוע מהמאה ה-19: כשמכונות הקיטור נעשו יעילות יותר, יותר חברות פרסו אותן, ובסופו של דבר צריכת הפחם גדלה דווקא. התבנית חזרה בתעשיית התעופה, שבה מטוסים חסכוניים יותר הוזילו כרטיסים ודרבנו גידול עצום בביקוש. כעת, הירידה במחיר הטוקנים לא מובילה לחיסכון, אלא לצריכה גבוהה בהרבה.
עבור חברות ישראליות המפעילות מערכות AI פנימיות, ובפרט סטארטאפים שבנו מוצרים מבוססי LLM בסביבת עלויות נמוכה יחסית, המסר ברור: תכנון ארכיטקטורת הטוקנים הוא כבר לא שיקול הנדסי משני אלא החלטה עסקית ממדרגה ראשונה. מודלים אגנטיים דורשים תכנון מוקפד של מספר הצעדים בכל תהליך, הגדרת מגבלות ברורות, ופיקוח תקציבי שוטף.
השאלה שמנהלים צריכים לשאול עצמם אינה עוד "האם ה-AI שלנו פרודוקטיבי?", אלא "האם עלות הטוקנים עדיין קטנה מערך התפוקה שהוא מייצר?" - ובמצב הנוכחי, התשובה לא תמיד חיובית.
