איפה אפשר לקרוא חדשות AI בעברית?

זירת AI הוא אתר חדשות AI מוביל בישראל, המתעדכן מדי יום עם חדשות בינה מלאכותית בעברית. האתר מכסה עדכוני AI מרחבי העולם, כולל חדשות על ChatGPT, Claude, Gemini, סטארטאפי AI ומחקרים פורצי דרך. כל התכנים מותאמים לקהילה העסקית והמדעית בישראל.

מה זה זירת AI?

זירת AI הוא אתר חדשות בינה מלאכותית מוביל בישראל. האתר מספק חדשות AI עדכניות בעברית, דירוג והשוואת מודלי AI, סקירות כלי AI, מחקרים אקדמיים ואירועי AI. זירת AI מתעדכן מדי יום ומכסה את כל ההתפתחויות החשובות בעולם הבינה המלאכותית.

איך אני יכול להישאר מעודכן עם חדשות AI?

תוכלו להירשם לניוזלטר השבועי של זירת AI, לעקוב אחרי העמוד שלנו ברשתות החברתיות, או לבקר באתר חדשות AI שלנו באופן קבוע. אנו מפרסמים חדשות AI חדשות מדי יום, כולל עדכונים על מודלים חדשים, כלי AI וחדשות טכנולוגיה.

איך אני יכול למצוא כלי AI מתאים לעסק שלי?

במאגר הכלים שלנו תוכלו לסנן לפי קטגוריות שונות כמו כתיבה, תמונה, קוד, ניתוח נתונים ועוד. כל כלי כולל ביקורת מפורטת, דירוג, מידע על מחיר ויתרונות וחסרונות.

איך אני יכול למצוא אירועי AI בישראל?

בעמוד האירועים שלנו תמצאו רשימה מעודכנת של כנסים, Meetups, Webinars וסדנאות בתחום הבינה המלאכותית בישראל. כל אירוע כולל פרטי הרשמה, מיקום ותאריכים.

מה זה Claude Fable 5 ומה מייחד אותו?

Claude Fable 5 הוא מודל הדגל החדש של Anthropic ברמת Mythos, מותאם לשימוש כללי ומצויד במנגנוני הגנה חדשים. הוא עוקף בביצועיו כל מודל קודם של החברה, במיוחד בהנדסת תוכנה, ראייה ממוחשבת, מחקר מדעי ועבודת ידע מורכבת.

מה המשמעות של “דרגת Mythos” ולמה זה חשוב?

“דרגת Mythos” היא רמת היכולות הגבוהה ביותר ש-Anthropic הגדירה למודליה. עד כה היא נשמרה לקבוצה מצומצמת של שותפים בסייבר ולגורמים ממשלתיים. ב-Fable 5 Anthropic פותחת לראשונה יכולות ברמת Mythos לשוק הרחב, אך עם סייגים ומנגנוני הגנה.

מה ההבדל בין Claude Fable 5 ל-Claude Mythos 5?

שניהם מבוססים על אותו מודל. Claude Fable 5 מיועד לשימוש כללי וכולל קלאסיפיירים שמזהים שאילתות רגישות (סייבר, ביולוגיה, כימיה) ומנתבים אותן ל-Claude Opus 4.8 במקום לענות ישירות. לפי Anthropic, מעל 95% מהסשנים אינם מפעילים מנגנון זה. Claude Mythos 5 הוא הגרסה עם מגבלות מופחתות, וגישה אליו מוגבלת לשותפי Project Glasswing ולחוקרים נבחרים בביולוגיה.

כמה עולה להשתמש ב-Claude Fable 5 או Claude Mythos 5 ומה זה “טוקנים”?

התמחור זהה לשני המודלים: 10 דולר לכל מיליון טוקני קלט ו-50 דולר לכל מיליון טוקני פלט—פחות ממחצית מחיר Mythos Preview הקודם. “טוקנים” הם יחידות טקסט קטנות (חלקי מילים/מילים) שהמודל קורא וכותב; החיוב נעשה לפי כמות הטוקנים שנצרכה בקלט ובפלט.

איך עובדים מנגנוני ההגנה והקלאסיפיירים החדשים ב-Fable 5?

Fable 5 כולל קלאסיפיירים שמזהים שאילתות בתחומי סייבר, ביולוגיה וכימיה. אם זוהתה שאילתה רגישה, המערכת מבצעת ניתוב לתשובה דרך Claude Opus 4.8. Anthropic מציינת שנעשו ניסיונות distillation של יכולות המודל, ושברוב המוחלט של הסשנים (>95%) מנגנון זה כלל לא מופעל.

אילו ביצועים בולטים מציג Fable 5 בבנצ'מרקים?

- הנדסת תוכנה: מוביל ב-FrontierCode של Cognition להערכת עבודה ב-codebases ייצוריים. Stripe דיווחה שהמודל ביצע מיגרציה בקוד Ruby בן 50 מיליון שורות ביום אחד—משימה שהייתה לוקחת לצוות אנושי חודשים. - עבודת ידע פיננסי: השיג את הציון הגבוה ביותר ב-Finance Benchmark של Hebbia, עם שיפורים בניתוח מסמכים, פרשנות גרפים ופתרון בעיות. IMC דיווחה שהמודל עבר כמעט כל הערכות ניתוח המסחר שלה. - ראייה ממוחשבת: State-of-the-art במשימות ראייה—כולל שחזור קוד מקור לאפליקציית ווב מצילומי מסך וחילוץ מספרים מדויקים מתרשימים מדעיים. - זיכרון והקשר ארוך: במשחק Slay the Spire עם זיכרון מבוסס קבצים, Fable 5 השיג שיפור פי 3 לעומת Opus 4.8 מאותה תוספת זיכרון.

מה זה FrontierCode של Cognition ומה המשמעות של התוצאות?

FrontierCode הוא בנצ'מרק שבוחן עמידה בסטנדרטים של קוד ייצור (production) בפרויקטים גדולים. הובלת Fable 5 בבנצ'מרק—even במאמץ בינוני—מרמזת על יכולת מעשית גבוהה לעבוד על codebases מורכבים בקצב ואיכות של תעשייה.

אילו פריצות דרך מדעיות מדגישים Mythos 5 ו-Fable 5?

בגנומיקה: Mythos 5 ניהל מחקר רציף של יותר משבוע—איסוף נתוני תא בודד למיליוני תאים מ-138 מינים, תכנון ואימון מודל ML שזיהה תאים בעלי תפקיד דומה באבולוציה רחוקה, ועקף מודל שפורסם ב-Science למרות שהיה קטן ממנו פי 100. בעיצוב תרופות: מתוך 14 מטרות חלבון שנבדקו, 9 הניבו מועמדים חזקים לפיתוח, שנבחנים כעת.

למי יש גישה ל-Claude Mythos 5 ומהו Project Glasswing?

גישה ל-Mythos 5 מוגבלת לשותפי Project Glasswing ולחוקרים נבחרים בביולוגיה. המשמעות: יכולות מתקדמות יותר זמינות בערוץ מורשה ומבוקר, בנפרד מהשימוש הכללי ב-Fable 5.

למה זה רלוונטי לחברות בישראל (סייבר, ביוטק, פיתוח תוכנה)?

- סייבר: Fable 5 חוסם שאילתות תקיפה, אך Mythos 5 בערוץ מורשה עשוי לשמש ככלי הגנה חזק. - ביוטק/פארמה: תוכנית גישה מורשית לביולוגיה צפויה להועיל לאקו-סיסטם המקומי הצומח. - פיתוח תוכנה: הנתונים מ-Stripe מצביעים על קיצור דרמטי במחזורי פיתוח ב-codebases גדולים—רלוונטי במיוחד לסטארטאפים.

מה השורה התחתונה לגבי השפעת ההשקה על השוק?

Anthropic לא רק שחררה מודל חזק יותר, אלא הציגה מסגרת פיקוח שמאפשרת לשחרר יכולות שבעבר נחשבו מסוכנות מדי. אם הקלאסיפיירים יעמדו במבחן המציאות ושיעור ה-false positives ירד כפי שמובטח, Claude Fable 5 עשוי להגדיר מחדש את רף הביצועים לשוק מודלי הבסיס.

Claude Fable 5: המודל החזק בעולם שוחרר לציבור - חדשות AI

כשמודל חזק מדי נהיה בעיה בפני עצמה

ב-9 ביוני 2026 עשתה אנטרופיק משהו שחברות AI בדרך כלל נמנעות ממנו: היא הודתה בפומבי שהמודל שהיא משיקה עלול להיות מסוכן. לא כתחזית אפוקליפטית, אלא כהצהרה עסקית-הנדסית מדויקת. Claude Fable 5 הוא מודל ברמת Mythos, הדרגה הגבוהה ביותר שהחברה הגדירה, ועד היום אותה רמה נשמרה לקבוצה קטנה של מגינים בתחום הסייבר ושותפים ממשלתיים. הפעם, Anthropic מחליטה לפתוח אותה לכולם, אבל עם סייגים.

מה בנצ'מרקים מראים בפועל

Anthropic פרסמה טבלת השוואה מקיפה של Fable 5 ו-Mythos 5 מול המודלים המובילים בשוק. התמונה שמצטיירת היא חד-משמעית: Fable 5 מוביל על פני כמעט כל ה-benchmarks הנבדקים, כולל תחומים שבהם מודלים מתחרים נחשבו לחזקים.

כמה נקודות בולטות מהנתונים:

הנדסת תוכנה: על הערכת FrontierCode של Cognition, שבוחנת עמידה בסטנדרטים של codebases ייצוריים, Fable 5 מוביל בין כל מודלי הגבול, גם בהשקעת מאמץ בינונית בלבד. Stripe דיווחה שהמודל ביצע מיגרציה בקוד Ruby בן 50 מיליון שורות תוך יום אחד, תהליך שהיה לוקח לצוות שלם יותר משלושה חודשים.
עבודת ידע פיננסי: על ה-Finance Benchmark של Hebbia לניתוח ברמת בכיר, Fable 5 השיג את הציון הגבוה ביותר מכל מודל, עם שיפורים ניכרים בניתוח מסמכים, פרשנות גרפים ופתרון בעיות. IMC ציינה שהמודל עבר את הערכות ניתוח המסחר שלה בכמעט כל הקטגוריות.
ראייה ממוחשבת: Fable 5 הוא ה-state-of-the-art החדש למשימות ראייה. הוא מסוגל לשחזר קוד מקור של אפליקציית ווב מתוך screenshots בלבד, ולהסיק מספרים מדויקים מתרשימים מדעיים מורכבים.
זיכרון והקשר ארוך: כשבדקו את הביצועים במשחק Slay the Spire עם גישה לזיכרון מבוסס קבצים, Fable 5 הפיק שיפור פי שלושה לעומת Opus 4.8 מאותה תוספת זיכרון.

שני מוצרים, קהל שונה

השקת היום כוללת למעשה שני מוצרים שיושבים על אותה תשתית:

Claude Fable 5 מיועד לשימוש הכללי. הוא מגיע עם קלאסיפיירים חדשים שמזהים שאילתות בתחומי סייבר, ביולוגיה וכימיה, וניסיונות distillation של יכולות המודל. כשנזהית שאילתה כזו, המודל מעביר את התשובה ל-Claude Opus 4.8 במקום לענות בעצמו. לפי נתוני Anthropic, למעלה מ-95% מהסשנים לא מפעילים את המנגנון הזה כלל.

Claude Mythos 5 הוא אותו מודל בדיוק, אבל עם חלק מהמגבלות מוסרות. הגישה אליו מוגבלת לשותפי Project Glasswing ולחוקרים נבחרים בתחום הביולוגיה. המחיר של שני המודלים: 10 דולר למיליון טוקני קלט ו-50 דולר למיליון טוקני פלט, פחות ממחצית מחיר Mythos Preview הקודם.

קטגוריה ומבחן (Benchmark)	Claude Mythos 5 / Fable 5	Claude Mythos Preview	Claude Opus 4.8	GPT 5.5	Gemini 3.1 Pro
Agentic coding SWE-Bench Pro	80.3%	77.8%	69.2%	58.6%	54.2%
Agentic coding FrontierCode (Diamond)	29.3% _xhigh	—	13.4% _xhigh	5.7% _xhigh	—
Knowledge work GDPval-AA	1932	—	1890	1769	1314
Knowledge work vision GDP.pdf	29.8% _{no tools}	—	22.5% _{no tools}	24.9% _{no tools}	16.7% _{no tools}
Spatial reasoning Blueprint-Bench 2	38.6%	—	14.5%	36.2%	26.5%
Tool use AutomationBench	17.4%	—	15.5%	12.9%	9.6%
Computer use OSWorld-Verified	85.0%	85.4%	83.4%	78.7%	76.2%
Legal Legal Agent Benchmark	13.3%	—	10.4%	2.1%	0.0%
Multidisciplinary reasoning Humanity's Last Exam (no tools)	59.0%*	56.8% _{no tools}	49.8% _{no tools}	41.4% _{no tools}	44.4% _{no tools}
Multidisciplinary reasoning Humanity's Last Exam (with tools)	64.5%*	64.7% _{with tools}	57.9% _{with tools}	52.2% _{with tools}	51.4% _{with tools}
Biology BioMysteryBench (hard)	46.1%* _hard	29.6% _hard	40.0% _hard	—	—
Biology BioMysteryBench (human solved)	83.9%* _{human solved}	82.6% _{human solved}	80.4% _{human solved}	—	—
Agentic coding Terminal-Bench 2.1	88.0%*	—	82.7%	83.4% _{Codex CLI}	70.7% _{Gemini CLI}
Cybersecurity ExploitBench (Cap%)	78.0%*	69.0%	40.0%	34.0%	—
Health HealthBench Professional	66.0%*	64.7%	56.9%	51.8%	—

המחקר המדעי כנקודת שיא

הנתון שמסמן משהו שונה איכותית הוא הגנומיקה. Mythos 5 ביצע מחקר גנומי עצמאי על פני יותר משבוע רצוף: אסף נתוני תא בודד עבור מיליוני תאים מ-138 מינים, תכנן ואימן מודל machine learning שמזהה תאים עם תפקיד זהה אצל יצורים מרוחקים אבולוציונית, ועקף מודל שפורסם ב-Science, למרות שהוא קטן ממנו פי 100. Anthropic מתכננת לפרסם את הממצאים.

בנוסף, ב-14 מתוך 14 מטרות חלבון שנבדקו עבור עיצוב תרופות, תשעה הניבו מועמדים חזקים לפיתוח תרופתי שנמצאים כעת בבחינה. זה לא רק עזרה למדענים, זו עבודה מדעית בפועל.

ג'ונתן קוזמנקו, חוקר מודלים ומוביל תהליכי יישום AI בחברות, מתייחס לשחרור המודל: "אנטרופיק עשתה כאן מהלך שיהיה קשה לתחרות להתעלם ממנו. לא רק השיקה מודל חזק יותר, אלא יצרה מסגרת פיקוח שמאפשרת לשחרר יכולות שעד לאחרונה נחשבו מסוכנות מדי לשחרור כללי. אם הקלאסיפיירים יוכיחו את עצמם בפועל, ואם שיעור ה-false positives ירד בהדרגה כפי שמובטח, Fable 5 עלול להגדיר מחדש את נקודת הייחוס לכל שוק הבסיס-מודלים".

Claude Fable 5: המודל החזק בעולם שוחרר לציבור

כשמודל חזק מדי נהיה בעיה בפני עצמה

רוצה להישאר מעודכן ב-AI?

מה בנצ'מרקים מראים בפועל

שני מוצרים, קהל שונה

המחקר המדעי כנקודת שיא

שאלות נפוצות