חוקרי סייבר מתוסכלים ממגבלות ה-Guardrails של Fable5

חוקרי סייבר מתוסכלים ממגבלות ה-Guardrails של Fable5

12 ביוני 2026
מערכת זירת AI

מודל ה-AI החדש של Anthropic, Fable, שוחרר לציבור כגרסה מוגבלת של מודל הסייבר Mythos - אך הגדרות הבטיחות שלו נרחבות מדי לטעמם של חוקרי אבטחה מקצועיים. אפילו בקשות שגרתיות כמו סקירת קוד נחסמות, מה שמעלה שאלות קריטיות על השימושיות המעשית של מודלי AI בתחום אבטחת המידע.

כשבטיחות הופכת למכשול: חוקרי סייבר מאוכזבים מ-Fable של Anthropic

שחרור מודל ה-AI החדש של Anthropic, Fable, נועד לסמן נקודת מפנה בשימוש ב-AI לצורכי אבטחת מידע. אך מאז השקתו ביום שלישי, חוקרים ואנשי מקצוע בתחום הסייבר מביעים תסכול גובר מגדרות הבטיחות הרחבות של המודל.

רוצה להישאר מעודכן ב-AI?

הירשם לדיוור השבועי שלנו וקבל עדכונים, המלצות על כלים, חדשות ודוחות מיוחדים

מה הוא Fable ולמה זה חשוב

Fable מוצג כגרסה ציבורית ומוגבלת של Mythos, מודל הסייבר הרב-עוצמה של Anthropic שהוצג לראשונה באפריל. בשלב הראשון הגישה ל-Mythos הוגבלה לחברות נבחרות במסגרת מה שכונה "Project Glasswing". לאחר מכן, בתחילת יוני, Anthropic הרחיבה את הגישה ל-Mythos למאות ארגונים ב-15 מדינות. Fable אמור לאפשר לקהל הרחב יותר להיחשף ליכולות הסייבר של החברה - אך עם מגבלות.

מה מפריע לחוקרים

הבעיה המרכזית: ה-Guardrails של Fable רגישים מדי, לדעת מומחים רבים. ולנטינה "Chompie" פלמיוטי, חוקרת אבטחה בכירה ב-IBM X-Force, ציינה כי המודל "דוחה כל בקשה שיכולה להיות קשורה לסייבר ולו בצורה שולית - אפילו משימות תמימות כמו קריאת פוסט בבלוג."

כאשר פרומפט מפעיל את המנגנון, Fable עוצר את השיחה ומודיע שה"אמצעי הבטיחות שלו סימנו את ההודעה בשל נושאי סייבר או ביולוגיה." במקרים כאלה, המודל חוזר אוטומטית ל-Claude Opus 4.8.

מאט סואישה, וותיק בתעשיית הסייבר וחבר צוות טכני ב-Tolmo, סטארטאפ AI בתחום אבטחת מידע, הסביר לאתר TechCrunch שהבעיה נעוצה בגישה מבוססת מילות מפתח: "אם אתה מבקש ממנו לכתוב קוד מאובטח, הוא מניח שמדובר בעבודת סייבר ולא בשיטות עבודה מומלצות בהנדסת תוכנה." חוקרים נוספים ב-X (לשעבר טוויטר) דיווחו שאפילו בקשה לביצוע סקירת קוד (Code Review) מפעילה את ה-Guardrails.

ההיגיון מאחורי ההגבלות

ה-Guardrails נועדו למנוע שימוש לרעה ב-Fable לצורך פיתוח תוכנות זדוניות (Malware) או פגיעה במערכות תוכנה. ההגבלות על נושאים ביולוגיים נובעות מחשש להשתמש במודל לפיתוח נשק ביולוגי - חשש שמלווה את Anthropic זה מכבר.

סואישה מוסיף פרספקטיבה מאוזנת: "עדיף לתפוס יותר מדי ממי שלא מספיק בעת שחרור כזה, ולהרפות מהגדרות הבטיחות עם הזמן. אני בטוח שהן ייתפתחו ככל ש-Anthropic וחברות מודלים אחרות ישתפו פעולה עם דור חדש של חברות סייבר."

ה-Cyber Verification Program - הפתרון הקיים

כדי לאזן בין הצורך בגישה מקצועית לבין הסיכון בשימוש לרעה, Anthropic מפעילה את ה-Cyber Verification Program, המאפשר לאנשי מקצוע בסייבר להגיש בקשה לקבלת הרשאות מורחבות. OpenAI מפעילה תוכנית דומה בשם Trusted Access for Cyber. אך האישור אינו מובטח, ועצם הצורך בתהליך הגשת בקשה מייצר חיכוך משמעותי בזרימת העבודה של חוקרים.

משמעות עבור שוק הסייבר הישראלי

למגמה זו יש השלכות ישירות על תעשיית הסייבר הישראלית, אחת הצפופות בעולם. חברות כמו CyberArk, Check Point, Sygnia ועשרות סטארטאפים אחרים שוקלות שילוב מודלי AI בתהליכי העבודה שלהן - מניתוח פגיעויות ועד תגובה לאירועים. כאשר מודל ה-AI המיועד לסייבר חוסם גם שאלות בסיסיות, הוא הופך לכלי מוגבל עבור אותם קהלים שעבורם נבנה. בטווח הקצר, ארגונים ישראלים שמעוניינים לשלב Fable בפעילותם יצטרכו להגיש בקשה ל-Cyber Verification Program ולבחון בזהירות את מגבלותיו.

שאלות נפוצות