איפה אפשר לקרוא חדשות AI בעברית?

זירת AI הוא אתר חדשות AI מוביל בישראל, המתעדכן מדי יום עם חדשות בינה מלאכותית בעברית. האתר מכסה עדכוני AI מרחבי העולם, כולל חדשות על ChatGPT, Claude, Gemini, סטארטאפי AI ומחקרים פורצי דרך. כל התכנים מותאמים לקהילה העסקית והמדעית בישראל.

מה זה זירת AI?

זירת AI הוא אתר חדשות בינה מלאכותית מוביל בישראל. האתר מספק חדשות AI עדכניות בעברית, דירוג והשוואת מודלי AI, סקירות כלי AI, מחקרים אקדמיים ואירועי AI. זירת AI מתעדכן מדי יום ומכסה את כל ההתפתחויות החשובות בעולם הבינה המלאכותית.

איך אני יכול להישאר מעודכן עם חדשות AI?

תוכלו להירשם לניוזלטר השבועי של זירת AI, לעקוב אחרי העמוד שלנו ברשתות החברתיות, או לבקר באתר חדשות AI שלנו באופן קבוע. אנו מפרסמים חדשות AI חדשות מדי יום, כולל עדכונים על מודלים חדשים, כלי AI וחדשות טכנולוגיה.

איך אני יכול למצוא כלי AI מתאים לעסק שלי?

במאגר הכלים שלנו תוכלו לסנן לפי קטגוריות שונות כמו כתיבה, תמונה, קוד, ניתוח נתונים ועוד. כל כלי כולל ביקורת מפורטת, דירוג, מידע על מחיר ויתרונות וחסרונות.

איך אני יכול למצוא אירועי AI בישראל?

בעמוד האירועים שלנו תמצאו רשימה מעודכנת של כנסים, Meetups, Webinars וסדנאות בתחום הבינה המלאכותית בישראל. כל אירוע כולל פרטי הרשמה, מיקום ותאריכים.

למה GPT-5 התחיל לדבר על “גובלינים” ו“גרמלינים”?

לפי הפרסום של OpenAI, מדובר ב“טיק” לשוני שהתפתח בהדרגה: המודל החל לשלב יותר מטאפורות על יצורים דמיוניים, בלי ירידה במדדי ביצועים רגילים. אחרי השקת GPT-5.1 נרשמה עלייה חדה באזכורים—“Goblin” עלה ב‑175% ו‑“Gremlin” ב‑52%—מה שהצביע על הטיה סגנונית שנכנסה לאימון.

איך אפשרות האישיות “Nerdy” תרמה לתופעת היצורים?

בבדיקה פנימית נמצא שהשימוש ביצורים היה מרוכז במיוחד אצל משתמשים שבחרו אישיות “Nerdy”, פרופיל שנועד להיות משחקי וחנוני. אף ש‑Nerdy היווה רק כ‑2.5% מהתשובות, הוא היה אחראי ל‑66.7% מאזכורי “Goblin”. כלומר, זו לא אופנה כללית אלא אופטימיזציה לסגנון ספציפי.

מה זה RLHF ואיך הוא יצר “לולאת משוב” של גובלינים?

RLHF (Reinforcement Learning from Human Feedback) הוא אימון בחיזוק שבו המודל מקבל תגמולים על פלטים מועדפים. כאן אות תגמול שנועד לחזק את סגנון Nerdy נטה להעדיף ניסוחים עם יצורים. כשהפלטים המתגמלים נכנסו חזרה לנתוני אימון מפוקח (SFT), ה“טיק” התחזק ונזל גם למצבים בלי Nerdy.

מה זה SFT ומה תפקידו בהטמעת דפוסים לא רצויים?

SFT (Supervised Fine-Tuning) הוא שלב שבו מאמנים את המודל על דוגמאות “נכונות”/רצויות. אם דוגמאות שנוצרו ע"י המודל (Rollouts) נכנסות שוב ל‑SFT כחלק מנתוני איכות/העדפה, דפוסים שקיבלו תגמול יכולים להפוך להרגל כללי. כך “סגנון” נקודתי עלול להתקבע במודל גם מחוץ לתנאי האימון המקוריים.

אילו צעדים ננקטו כדי לצמצם את תופעת “הגובלינים”?

כדי לעצור את התופעה, OpenAI פרשה את אישיות Nerdy, הסירה את אות התמריץ שעודד “חיבת יצורים”, וסיננה נתוני אימון עם מילות יצורים כדי לצמצם הופעות לא מתאימות. מאחר שגרסה מתקדמת כבר הייתה באימון, נוספה גם הנחיית מפתח שמטרתה לדכא את הזיקה ליצורים בבדיקות פנימיות.

למה המקרה הזה חשוב למפתחים וחוקרי בינה מלאכותית?

הסיפור מדגים שאותות תגמול קטנים יכולים לשנות סגנון, אוצר מילים ונורמות שיחה בלי להופיע מיד במדדי איכות סטנדרטיים. הוא גם מדגיש את הסיכון שבהכללה: תכונה שתוגמלה בפרופיל אחד יכולה לזלוג לכל המודל. בעקבות החקירה פותחו כלים טובים יותר לאיתור דפוסים חריגים ולאבחון מקורם.

הארי פוטר קם לתחייה? למה GPT-5 התחיל לדבר על גובלינים - חדשות AI

תופעת “הגובלינים” במודלי GPT-5 היא לא בדיחה פנימית, אלא שיעור מעשי באיך תמריצים קטנים באימון יכולים להטות התנהגות של מודלי AI, כפי שנחשף בפרסום של OpenAI.

כשהמודל מתחיל להעדיף מטאפורות עם יצורים

ב-OpenAI מספרים כי החל מהשקת GPT-5.1 הם זיהו דפוס שהתחיל כ'טיק' קטן: המודל מרבה לשלב בתשובות מטאפורות על גובלינים, גרמלינים ויצורים דמיוניים נוספים. בניגוד לתקלות “קלאסיות” שנמדדות בירידה בביצועים או בקפיצה במדדים, כאן מדובר בהרגל לשוני שזחל לאט והפך בולט יותר מדור לדור.

הסימנים הראשונים התחדדו בנובמבר, זמן קצר אחרי השקת GPT-5.1, בעקבות תלונות משתמשים על טון “חברי מדי” ותבניות דיבור חוזרות. צוות הבטיחות הוסיף במפורש את המילים “Goblin” ו-“Gremlin” לבדיקה, וגילה שמספר האזכורים של “Goblin” עלה ב-175% לאחר ההשקה, בעוד “Gremlin” עלה ב-52%.

הרמז הגדול: אישיות 'Nerdy' והנדסת תמריצים לא מכוונת

הפריצה בחקירה הגיעה סביב GPT-5.4, כשגם עובדים וגם משתמשים שמו לב לעלייה נוספת בשכיחות היצורים. בבדיקה פנימית נמצא שהשימוש בשפת יצורים היה מרוכז במיוחד בקרב משתמשים שבחרו באפשרות התאמת האישיות “Nerdy”, פרופיל שנועד להיות משחקי, חכם ולא מתנצל על הנטייה ל'חנוניות'.

לפי OpenAI, למרות ש-Nerdy ייצג רק כ-2.5% מכלל התשובות ב-ChatGPT, הוא היה אחראי ל-66.7% מכל אזכורי ה-“Goblin”. המשמעות הייתה שהבעיה אינה “טרנד אינטרנטי” שמתפזר באופן אחיד, אלא תוצאה של אופטימיזציה ממוקדת לסגנון מסוים.

איך RL יצר “לולאת משוב” של גובלינים

בחקירה השתמשו בכלים פנימיים וב-Codex כדי להשוות פלטים שנוצרו במהלך אימון בחיזוק (Reinforcement Learning, בדגש על RLHF או גרסאות דומות) בין תשובות עם המילים “Goblin/Gremlin” לבין תשובות ללא אותן מילים. אות חזק במיוחד הופיע באות תמריץ שנועד לעודד את אישיות Nerdy: הוא נטה לתת ציון גבוה יותר לניסוחים שכללו יצורים. OpenAI מדווחת כי ב-76.2% ממאגרי הנתונים שנבדקו, אות התמריץ של Nerdy העניק “יתרון” עקבי לפלטים עם גובלינים או גרמלינים.

החלק המעניין יותר היה הזליגה עצמה: גם כאשר לא הופעלה אישיות Nerdy, שכיחות האזכורים עלתה כמעט באותו יחס כמו בדגימות עם Nerdy. הסבר אפשרי, כפי שמתארת OpenAI, הוא הכללה של ההתנהגות מחוץ לתנאי האימון המקורי.

באימון מודרני למודלי שפה, התנהגות שמקבלת תגמול עשויה להיטמע כמנגנון “כללי” של המודל, במיוחד כאשר דגימות שנוצרו על ידי המודל (Rollouts) חוזרות אחר כך לאימון מפוקח (SFT) כחלק מנתוני העדפה או דוגמאות איכות.

התוצאה היא לולאת משוב: מחזקים סגנון משחקי, חלק מהדוגמאות המתגמלות כוללות טיק ייחודי, הטיק מופיע יותר, ואז נכנס שוב לנתוני אימון ומתחזק. לפי הדוח, בסריקת נתוני ה-SFT של GPT-5.5 נמצאה גם “משפחת יצורים” רחבה יותר כמו דביבונים, טרולים, אוגרים ויונים, בעוד שמרבית ההופעות של 'צפרדע' (המילה “Frog”) היו לגיטימיות בהקשר.

מה OpenAI שינתה, ולמה זה חשוב לקהילת ה-AI

כדי לעצור את התופעה, OpenAI פרשה את אישיות Nerdy באמצע מרץ לאחר השקת GPT-5.4, הסירה את אות תמריץ ה”חובב יצורים” וסיננה נתוני אימון שהכילו מילות יצורים כדי לצמצם הופעות לא מתאימות. עם זאת, GPT-5.5 כבר היה בתהליך אימון לפני שנמצא שורש הבעיה, ובבדיקות מוקדמות ב-Codex עובדים זיהו מיד “זיקה לגובלינים”, ולכן נוספה גם הנחיית מפתח שמטרתה לדכא זאת.

OpenAI מדגישה שהסיפור משמש דוגמה חדה לסיכון מחקרי-מוצרי: אותות תגמול קטנים יכולים לשנות סגנון, מילון ואפילו נורמות שיחה, בלי שהדבר יופיע מיד במדדי ביצועים סטנדרטיים. מעבר לאנקדוטה המשעשעת, החברה מציינת שהחקירה הולידה כלים חדשים להאצת איתור דפוסים חריגים, לאבחון מקורם ולתיקון בעיות התנהגות “מהשורש”, לפני שהן הופכות להרגל יציב במודל שמגיע למיליוני משתמשים.

הארי פוטר קם לתחייה? למה GPT-5 התחיל לדבר על גובלינים

כשהמודל מתחיל להעדיף מטאפורות עם יצורים

רוצה להישאר מעודכן ב-AI?

הרמז הגדול: אישיות 'Nerdy' והנדסת תמריצים לא מכוונת

איך RL יצר “לולאת משוב” של גובלינים

מה OpenAI שינתה, ולמה זה חשוב לקהילת ה-AI

שאלות נפוצות