
קרדיט תמונה: zirat ai
Claude Fable 5: המודל החזק בעולם שוחרר לציבור
Anthropic השיקה את Claude Fable 5, מודל ברמת Mythos שהותאם לשימוש כללי עם מנגנוני הגנה חדשים. הביצועים עוקפים כל מודל שהחברה שחררה עד כה, עם יכולות יוצאות דופן בהנדסת תוכנה, ראייה ממוחשבת, מחקר מדעי ועבודת ידע מורכבת. המחיר: 10 דולר למיליון טוקני קלט ו-50 דולר למיליון טוקני פלט.
כשמודל חזק מדי נהיה בעיה בפני עצמה
ב-9 ביוני 2026 עשתה אנטרופיק משהו שחברות AI בדרך כלל נמנעות ממנו: היא הודתה בפומבי שהמודל שהיא משיקה עלול להיות מסוכן. לא כתחזית אפוקליפטית, אלא כהצהרה עסקית-הנדסית מדויקת. Claude Fable 5 הוא מודל ברמת Mythos, הדרגה הגבוהה ביותר שהחברה הגדירה, ועד היום אותה רמה נשמרה לקבוצה קטנה של מגינים בתחום הסייבר ושותפים ממשלתיים. הפעם, Anthropic מחליטה לפתוח אותה לכולם, אבל עם סייגים.
רוצה להישאר מעודכן ב-AI?
הירשם לדיוור השבועי שלנו וקבל עדכונים, המלצות על כלים, חדשות ודוחות מיוחדים
מה בנצ'מרקים מראים בפועל
Anthropic פרסמה טבלת השוואה מקיפה של Fable 5 ו-Mythos 5 מול המודלים המובילים בשוק. התמונה שמצטיירת היא חד-משמעית: Fable 5 מוביל על פני כמעט כל ה-benchmarks הנבדקים, כולל תחומים שבהם מודלים מתחרים נחשבו לחזקים.
כמה נקודות בולטות מהנתונים:
- הנדסת תוכנה: על הערכת FrontierCode של Cognition, שבוחנת עמידה בסטנדרטים של codebases ייצוריים, Fable 5 מוביל בין כל מודלי הגבול, גם בהשקעת מאמץ בינונית בלבד. Stripe דיווחה שהמודל ביצע מיגרציה בקוד Ruby בן 50 מיליון שורות תוך יום אחד, תהליך שהיה לוקח לצוות שלם יותר משלושה חודשים.
- עבודת ידע פיננסי: על ה-Finance Benchmark של Hebbia לניתוח ברמת בכיר, Fable 5 השיג את הציון הגבוה ביותר מכל מודל, עם שיפורים ניכרים בניתוח מסמכים, פרשנות גרפים ופתרון בעיות. IMC ציינה שהמודל עבר את הערכות ניתוח המסחר שלה בכמעט כל הקטגוריות.
- ראייה ממוחשבת: Fable 5 הוא ה-state-of-the-art החדש למשימות ראייה. הוא מסוגל לשחזר קוד מקור של אפליקציית ווב מתוך screenshots בלבד, ולהסיק מספרים מדויקים מתרשימים מדעיים מורכבים.
- זיכרון והקשר ארוך: כשבדקו את הביצועים במשחק Slay the Spire עם גישה לזיכרון מבוסס קבצים, Fable 5 הפיק שיפור פי שלושה לעומת Opus 4.8 מאותה תוספת זיכרון.
שני מוצרים, קהל שונה
השקת היום כוללת למעשה שני מוצרים שיושבים על אותה תשתית:
Claude Fable 5 מיועד לשימוש הכללי. הוא מגיע עם קלאסיפיירים חדשים שמזהים שאילתות בתחומי סייבר, ביולוגיה וכימיה, וניסיונות distillation של יכולות המודל. כשנזהית שאילתה כזו, המודל מעביר את התשובה ל-Claude Opus 4.8 במקום לענות בעצמו. לפי נתוני Anthropic, למעלה מ-95% מהסשנים לא מפעילים את המנגנון הזה כלל.
Claude Mythos 5 הוא אותו מודל בדיוק, אבל עם חלק מהמגבלות מוסרות. הגישה אליו מוגבלת לשותפי Project Glasswing ולחוקרים נבחרים בתחום הביולוגיה. המחיר של שני המודלים: 10 דולר למיליון טוקני קלט ו-50 דולר למיליון טוקני פלט, פחות ממחצית מחיר Mythos Preview הקודם.
| קטגוריה ומבחן (Benchmark) | Claude Mythos 5 / Fable 5 | Claude Mythos Preview | Claude Opus 4.8 | GPT 5.5 | Gemini 3.1 Pro |
|---|---|---|---|---|---|
| Agentic coding SWE-Bench Pro | 80.3% | 77.8% | 69.2% | 58.6% | 54.2% |
| Agentic coding FrontierCode (Diamond) | 29.3% xhigh | — | 13.4% xhigh | 5.7% xhigh | — |
| Knowledge work GDPval-AA | 1932 | — | 1890 | 1769 | 1314 |
| Knowledge work vision GDP.pdf | 29.8% no tools | — | 22.5% no tools | 24.9% no tools | 16.7% no tools |
| Spatial reasoning Blueprint-Bench 2 | 38.6% | — | 14.5% | 36.2% | 26.5% |
| Tool use AutomationBench | 17.4% | — | 15.5% | 12.9% | 9.6% |
| Computer use OSWorld-Verified | 85.0% | 85.4% | 83.4% | 78.7% | 76.2% |
| Legal Legal Agent Benchmark | 13.3% | — | 10.4% | 2.1% | 0.0% |
| Multidisciplinary reasoning Humanity's Last Exam (no tools) | 59.0%* | 56.8% no tools | 49.8% no tools | 41.4% no tools | 44.4% no tools |
| Multidisciplinary reasoning Humanity's Last Exam (with tools) | 64.5%* | 64.7% with tools | 57.9% with tools | 52.2% with tools | 51.4% with tools |
| Biology BioMysteryBench (hard) | 46.1%* hard | 29.6% hard | 40.0% hard | — | — |
| Biology BioMysteryBench (human solved) | 83.9%* human solved | 82.6% human solved | 80.4% human solved | — | — |
| Agentic coding Terminal-Bench 2.1 | 88.0%* | — | 82.7% | 83.4% Codex CLI | 70.7% Gemini CLI |
| Cybersecurity ExploitBench (Cap%) | 78.0%* | 69.0% | 40.0% | 34.0% | — |
| Health HealthBench Professional | 66.0%* | 64.7% | 56.9% | 51.8% | — |
המחקר המדעי כנקודת שיא
הנתון שמסמן משהו שונה איכותית הוא הגנומיקה. Mythos 5 ביצע מחקר גנומי עצמאי על פני יותר משבוע רצוף: אסף נתוני תא בודד עבור מיליוני תאים מ-138 מינים, תכנן ואימן מודל machine learning שמזהה תאים עם תפקיד זהה אצל יצורים מרוחקים אבולוציונית, ועקף מודל שפורסם ב-Science, למרות שהוא קטן ממנו פי 100. Anthropic מתכננת לפרסם את הממצאים.
בנוסף, ב-14 מתוך 14 מטרות חלבון שנבדקו עבור עיצוב תרופות, תשעה הניבו מועמדים חזקים לפיתוח תרופתי שנמצאים כעת בבחינה. זה לא רק עזרה למדענים, זו עבודה מדעית בפועל.
ג'ונתן קוזמנקו, חוקר מודלים ומוביל תהליכי יישום AI בחברות, מתייחס לשחרור המודל: "אנטרופיק עשתה כאן מהלך שיהיה קשה לתחרות להתעלם ממנו. לא רק השיקה מודל חזק יותר, אלא יצרה מסגרת פיקוח שמאפשרת לשחרר יכולות שעד לאחרונה נחשבו מסוכנות מדי לשחרור כללי. אם הקלאסיפיירים יוכיחו את עצמם בפועל, ואם שיעור ה-false positives ירד בהדרגה כפי שמובטח, Fable 5 עלול להגדיר מחדש את נקודת הייחוס לכל שוק הבסיס-מודלים".
