
למה ה-AI של Google לא יודע לאיית את שמה שלה
Google שילבה AI Overviews במנוע החיפוש שלה, אך הכלי כבר מגלה כישלונות בסיסיים: שגיאות איות מביכות, כולל איות שגוי של המילה Google עצמה. הסיבה טכנית ועמוקה - אדריכלות ה-Transformer שעליה בנויים LLMs פשוט לא קוראת אותיות. עבור מנהלים שמטמיעים כלי AI בארגון, זו תזכורת חשובה לגבולות הטכנולוגיה.
ה-AI של Google לא יודע לאיית את המילה Google
שאלו את Google כמה אותיות P יש בשמה - והיא תענה: שתיים. שאלו כמה אותיות R יש במילה "strawberry" - ותקבלו תשובה שגויה. כך עולה מדיווח של אמנדה זילברלינג ב-TechCrunch, שתיעדה שגיאות איות בסיסיות שמייצר כלי ה-AI Overviews של Google בחיפוש.
רוצה להישאר מעודכן ב-AI?
הירשם לדיוור השבועי שלנו וקבל עדכונים, המלצות על כלים, חדשות ודוחות מיוחדים
לפי הדיווח, ה-AI של Google איית את שם נשיא ארצות הברית כ-t-r-p-u-m, קבע שיש שתי אותיות d במילה journalism ואיית אותה כ-j-o-u-r-n-a-d-i-s-m, ואמר שיש בדיוק אות r אחת במילה poop. Google אישרה לאמנדה זילברלינג מ-TechCrunch בתגובה רשמית: "ספירת אותיות בתוך מילים היא אתגר מוכר עבור LLMs, ואנחנו עובדים לתקן את הבעיה הספציפית הזו."
הסיבה הטכנית: Tokens, לא אותיות
הכשל אינו תקלה מקרית - הוא נובע מהאופן שבו LLMs בנויים ברמה הארכיטקטונית. מודלים מבוססי Transformer, כמו אלה שמניעים את Google Gemini, אינם קוראים טקסט כפי שבני אדם קוראים. הם ממירים מילים ל-Tokens - שעשויים להיות מילה שלמה, הברה, או אות - ולאחר מכן מבצעים עיבוד מתמטי של ייצוגים מספריים.
כפי שהסביר מתיו גוזדיאל, חוקר AI ופרופסור עוזר באוניברסיטת אלברטה, ל-TechCrunch בעבר: "כאשר המודל רואה את המילה 'the', יש לו ייצוג של מה ש-'the' אומר, אך הוא לא יודע דבר על T, H, E."
ז'ריידן פוישט, דוקטורנטית החוקרת פרשנות LLMs באוניברסיטת נורת'איסטרן, הוסיפה כי "אין דבר כזה מגדיר טוקנים מושלם" - הבעיה גלומה בתכנון הבסיסי של הטכנולוגיה.
לא אתגר חדש - אך כעת הוא ב-Google Search
המבוכה הנוכחית אינה הראשונה. כאשר Google השיקה בפעם הראשונה את AI Overviews בחיפוש, הכלי יעץ למשתמשים לאכול סלעים ולשים דבק על פיצה, תוך הסתמכות על פוסטים סאטיריים. לאחרונה גם תוקן באג שבו חיפוש המילה "disregard" הניב כתגובה "Understood. Let me know whenever you have a new prompt or question" - אך שגיאות האיות ממשיכות.
המשמעות הישירה למנהלים ולחברות שמשלבות AI בתהליכי עבודה היא שהכלים הגנרטיביים המובילים ביותר בשוק - כולל אלה של Google - נכשלים בפעולות שכל ילד בגן מסוגל לבצע. LLM שיכול לכתוב קוד מורכב תוך שניות עלול להכשל בספירה בסיסית של אותיות.
ה-AI חזק בהסקת הקשרים ובייצור תוכן, אבל חלש מאוד בכל מה שדורש הבנה סמנטית של מבנה המילה עצמה. זו אינה חולשה שצפויה להיעלם בגרסה הבאה של המודל - היא נובעת מהגדרה ארכיטקטונית יסודית, כפי שפורסם על ידי TechCrunch.
