
קרדיט תמונה: Anthropic
קלוד סונט 5 כאן! אנטרופיק משיקה את Sonnet 5: ביצועי סוכנים במחיר נמוך יותר
אנטרופיק השיקה את קלוד סונט 5 (Claude Sonnet 5), דגם בינוני עם יכולות אוטונומיות משופרות המוצב כחלופה זולה יותר ל-Opus 4.8, GPT-5.5 ו-Gemini 3.1 Pro. המחיר ההתחלתי עומד על 2 דולר למיליון טוקני קלט ו-10 דולר למיליון טוקני פלט עד לסוף אוגוסט, ומשדר בבירור: יכולות agentic הן כבר לא יתרון תחרותי, אלא רף בסיסי.
Claude Sonnet 5: כשיכולות הסוכן הופכות לנגישות לכולם
Anthropic השיקה השבוע את Claude Sonnet 5, גרסה משודרגת של הדגם הבינוני שלה, המשלבת יכולות agentic מתקדמות במחיר הנמוך משמעותית מהדגמים הגדולים בשוק. המהלך מגיע בתקופה שבה כל ספקיות ה-LLM המובילות מתחרות על הגדרת המחיר הראוי לביצועים אוטונומיים - ומדגיש שהשאלה כבר אינה מי מסוגל להריץ סוכנים, אלא מי יעשה זאת בצורה אמינה ובמחיר תחרותי.
רוצה להישאר מעודכן ב-AI?
הירשם לדיוור השבועי שלנו וקבל עדכונים, המלצות על כלים, חדשות ודוחות מיוחדים
מה מציע Sonnet 5
לפי Anthropic, Sonnet 5 מסוגל לתכנן, לבצע חיפושי רשת, להפעיל טרמינלים ולפעול באופן עצמאי ברמה שלפני כמה חודשים דרשה דגמים גדולים ויקרים יותר (כפי שפורסם ב-TechCrunch על ידי רבקה בלן). בביצועי coding agentic, Sonnet 5 רשם ציון של 63.2% לעומת 58.1% של Sonnet 4.6 ו-69.2% של Opus 4.8. בבנצ'מרק של עבודת ידע, Sonnet 5 אף עלה מעט על Opus 4.8.
הדגם יהפוך ל-default עבור משתמשי החינם ומנויי Pro החל מהשבוע, ויהיה זמין בכל רמות המנוי.
| מדד / מודל | Sonnet 5 | Sonnet 4.6 | Opus 4.8 (להשוואה) |
|---|---|---|---|
| קידוד סוכני (Agentic coding) SWE-bench Pro | 63.2% | 58.1% | 69.2% |
| קידוד סוכני (Agentic coding) Terminal-Bench 2.1 | 80.4% | 67.0% | 82.7% |
| חשיבה רב-תחומית (Multidisciplinary reasoning) Humanity's Last Exam | 43.2% (ללא כלים) 57.4% (עם כלים) | 34.6% (ללא כלים) 46.8% (עם כלים) | 49.8% (ללא כלים) 57.9% (עם כלים) |
| שימוש במחשב (Computer use) OSWorld-Verified | 81.2% | 78.5% | 83.4% |
| עבודת ידע (Knowledge work) GDPval-AA v2 | 1618 | 1395 | 1615 |
מחיר תחרותי עם תאריך תפוגה
התמחור בשלב ההשקה עומד על 2 דולר למיליון טוקני קלט ו-10 דולר למיליון טוקני פלט - עד ה-31 באוגוסט. לאחר מכן המחיר יעלה ל-3 דולר ו-15 דולר בהתאמה. גם במחיר הגבוה יותר, Sonnet 5 נמוך מ-Opus 4.8 של Anthropic עצמה, מ-GPT-5.5 של OpenAI ומ-Gemini 3.1 Pro של Google - אם כי עדיין יקר יותר מ-Gemini 3.5 Flash.
חשוב לציין כי OpenAI השיקה בשבוע שעבר את GPT-5.6 Sol בתצוגה מקדימה, המוצב גם הוא כדגם agentic מתקדם, ו-Google השיקה במאי את Gemini 3.5 Flash כמעבר מצ'אטבוט שיחתי לכלי agentic. שלושת ההשקות יחד מסמנות שינוי מגמה ברור: יכולות הסוכן הן כעת רף הבסיס, לא בידול.
ביצועים בשטח: פחות עצירות, יותר השלמה
Daniel Shepard, מהנדס בכיר ב-Zapier, שיתף ממצא משמעותי: Sonnet 5 השלים משימה כפולה - עדכון רמות חשבונות ב-Salesforce ושליחת הודעת השקה ללקוחות Enterprise - מקצה לקצה, ללא תקיעה באמצע. לדבריו, משימות דומות היו נתקעות בגרסאות קודמות.
המשמעות עבור חברות ישראליות העובדות עם כלי אוטומציה כמו Zapier, Make או פתרונות דומים היא ישירה: דגם שמסיים זרימות עבודה מורכבות ללא התערבות אנושית חוזרת מוריד את עלות התפעול ואת צוואר הבקבוק האנושי. עבור צוותי פיתוח ישראליים הבונים מוצרים מבוססי AI, Sonnet 5 מציע כעת נקודת כניסה כלכלית יותר לבנייה על גבי מודל שנחשב מהימן.
שיפורים בבטיחות
Anthropicדיווחה כי Sonnet 5 מפגין שיעור נמוך יותר של "התנהגויות לא רצויות" בהשוואה ל-Sonnet 4.6 - כולל שיפור בסירוב לבקשות זדוניות, התנגדות להתקפות prompt injection, ושיעורים נמוכים יותר של הזיות ו-sycophancy. עם זאת, Anthropic מבהירה כי הדגם אינו מגיע לרמת Opus 4.8 בהיבטי בטיחות מתקדמים, ובפרט מדגישה כי יכולתו לבצע משימות סייבר מסוכנות נמוכה מדגמי ה-Opus.
Fabian Hedin, מייסד-שותף של Lovable, ציין כי Sonnet 5 "מסרב לבקשות לא בטוחות בצורה נקייה ועקבית" - מאפיין קריטי לפלטפורמות המעמידות כלים חזקים בידי קהל רחב.
הגיון השוק: מחיר לפני כל שיקול אחר
האמת הפרגמטית שמשתמעת מהשקת Sonnet 5 היא שהשוק עובר לבחינה לפי יחס עלות-ביצוע בלבד. כשדגם בינוני מגיע לקרוב ל-90% מביצועי הדגם הגדול במחיר נמוך בהרבה, הלחץ על צוותים לבחור בדגמים יקרים יותר הופך להיות קשה להצדקה. Anthropic, כמו מתחרותיה, מתאמת עצמה לעולם שבו ה-ROI על כל קריאת API יהיה המדד המכריע.
