מודל שפה קטן לזיהוי רגשות: כך SLM פתוח משנה ניתוח סנטימנט בעסקים

מודל שפה קטן לזיהוי רגשות: כך SLM פתוח משנה ניתוח סנטימנט בעסקים

7 ביוני 2026
מערכת זירת AI
מקור:זירת AI

מאמר טכני חדש מדגים כיצד לכוונן את Mistral Small 3.1 לזיהוי 15 רגשות בטקסטים חברתיים, תוך התמודדות עם חוסר איזון חריף בנתוני האימון. מעבר להישג הטכני, מדובר באיתות חשוב לשוק: ניתוח רגשות מפורט, פתוח וזול יותר, הופך לכלי עסקי מעשי.

מעבר לניתוח סנטימנט: למה עסקים צריכים זיהוי רגשות אמיתי

ניתוח סנטימנט קלאסי, שמסווג טקסט כחיובי, שלילי או ניטרלי, כבר אינו מספיק עבור ארגונים שמנסים להבין לקוחות בזמן אמת. תלונת לקוח יכולה להיות גם כועסת, גם מאוכזבת וגם מבולבלת. פוסט ברשת חברתית יכול לשלב התלהבות עם חשש. כאן נכנס לתמונה זיהוי רגשות רב תוויתי, שמפרק את הטון הרגשי לקטגוריות כמו כעס, פחד, אכזבה, שמחה, אהבה, הפתעה ואישור.

רוצה להישאר מעודכן ב-AI?

הירשם לדיוור השבועי שלנו וקבל עדכונים, המלצות על כלים, חדשות ודוחות מיוחדים

הפרויקט המתואר במקור מציג כוונון של Mistral Small 3.1, מודל שפה קטן יחסית עם משקולות פתוחות, למשימת זיהוי רגשות על בסיס GoEmotions, מאגר נתונים של גוגל הכולל עשרות אלפי תגובות Reddit שסומנו ידנית. הבחירה במודל פתוח אינה רק החלטה טכנית. עבור חברות, היא נוגעת לשליטה במידע, שקיפות, עלויות תפעול ורישוי. במקום לשלוח מידע רגיש לממשק סגור, ניתן להפעיל מודל פנימי, להתאים אותו לתחום העסקי ולפקח טוב יותר על התנהגותו.

האתגר האמיתי: נתונים לא מאוזנים

אחת הבעיות המרכזיות בזיהוי רגשות היא שחלק מהרגשות מופיעים הרבה יותר מאחרים. ב-GoEmotions, למשל, התווית הניטרלית דומיננטית, בעוד רגשות כמו גועל, פחד או התרגשות מופיעים בתדירות נמוכה בהרבה. אם מאמנים מודל על התפלגות כזו ללא טיפול מקדים, הוא לומד להיות זהיר מדי ומעדיף את המחלקות הנפוצות. התוצאה העסקית עלולה להיות מסוכנת: מערכת שמפספסת זעם מתגבר בקרב לקוחות, או אינה מזהה פחד סביב מוצר פיננסי חדש.

הפתרון שנבחר משלב שלוש שכבות. ראשית, דילול של דוגמאות ניטרליות כדי להפחית את כוחן היחסי. שנית, יצירת דוגמאות סינתטיות למחלקות נדירות באמצעות ISMOTE, גרסה משופרת של SMOTE שמנסה לייצר פיזור מציאותי יותר של דוגמאות מיעוט. שלישית, שימוש ב-focal loss, פונקציית הפסד שמעניקה משקל גבוה יותר למקרים קשים או נדירים. השילוב הזה חשוב משום שאין קסם יחיד בבעיות חוסר איזון. נדרש טיפול גם בנתונים, גם בארכיטקטורת האימון וגם במדדי ההערכה.

למה Mistral Small 3.1 מעניין במיוחד

Mistral Small 3.1 הוא מודל 24 מיליארד פרמטרים, קטן ביחס למודלי ענק אך חזק מספיק למשימות שפה מורכבות. באמצעות LoRA וכימות ל-4 ביט, ניתן לכוונן אותו באופן יעיל יותר, גם אם עדיין נדרש חומרה רצינית. בפרויקט דווח על אימון של כ-9.5 שעות על NVIDIA RTX 6000 עם 192GB זיכרון. זה אינו תרחיש שמתאים לכל סטארטאפ בתחילת הדרך, אך הוא כבר במסגרת אפשרית עבור גופי מחקר, חברות דאטה וארגונים גדולים.

המדדים שפורסמו מרשימים יחסית למשימה רב תוויתית: Macro F1 של כ-0.82, ובמספר רגשות מרכזיים כמו פחד, גועל, עצב, הפתעה והתרגשות התקבלו תוצאות גבוהות במיוחד. עם זאת, יש לקרוא את המספרים בזהירות. אימון על Reddit באנגלית אינו מבטיח ביצועים זהים במוקד שירות, בשפה משפטית, בעברית, בערבית או בשיח ארגוני פנימי. כל פריסה עסקית רצינית תדרוש בדיקות תחומיות, כיול ספים ובקרה אנושית.

המשמעות לשוק ה-AI הארגוני

הכיוון ברור: מודלים קטנים ומכווננים מתחילים להחליף פתרונות כלליים ויקרים בנישות שבהן דיוק, פרטיות והתאמה חשובים יותר מיכולות שיחה רחבות. זיהוי רגשות יכול לשמש ניטור מותג, דירוג פניות שירות לפי חומרה רגשית, ניתוח תגובות לקמפיינים, התרעה על משברי אמון ואף תעדוף טיפול בלקוחות פגיעים.

הלקח המרכזי למנהלי מוצר ודאטה הוא שלא מספיק לבחור מודל חזק. איכות הפתרון נקבעת בדרך שבה מכינים את הנתונים, מטפלים בהטיות, מודדים ביצועים לפי מחלקות ולא רק בממוצע, ומתאימים את המודל להקשר העסקי. SLM פתוח ומכוונן היטב עשוי להיות פחות נוצץ ממודל ענק מסחרי, אבל במשימות ממוקדות הוא יכול להיות מדויק, שקוף ומשתלם הרבה יותר.

שאלות נפוצות