חזרה לחדשות
OpenAI מציגה: GPT-5.1 למפתחים עם חשיבה אדפטיבית, מצב ללא-ריזונינג וכלי קוד חדשים

קרדיט תמונה: Zirat AI / AI

OpenAI מציגה: GPT-5.1 למפתחים עם חשיבה אדפטיבית, מצב ללא-ריזונינג וכלי קוד חדשים

13 בנובמבר 2025
מערכת זירת AI

OpenAI הכריזה על GPT-5.1 ב-API: מודל מהיר וחסכוני יותר בטוקנים הודות לחשיבה אדפטיבית ומצב 'ללא ריזונינג' כברירת מחדל. ההשקה כוללת קאשינג מורחב ל-24 שעות, שיפורי קוד ויכולת הפעלה של שני כלים חדשים apply_patch ו-shell. תמחור וזהות שיעורי השימוש נותרו כמו GPT-5, עם זמינות לכל הלקוחות המנויים.

OpenAI: הושק GPT-5.1 למפתחים, המאזן בין אינטליגנציה למהירות ומציג חשיבה אדפטיבית וקפיצת מדרגה בכלי קידוד. כך עולה מהפרסום של OpenAI מהיום.

מה חדש ב-GPT-5.1

  • חשיבה אדפטיבית: המודל מקצר משמעותית את זמן החשיבה במשימות פשוטות ומאריך היכן שנדרש עומק ורובסטיות. בדוגמה של פקודת npm בסיסית, המענה התקצר מכ-10 שניות לכ-2 שניות.
  • מצב ללא ריזונינג: ניתן להגדיר reasoning_effort ל-none, המאפשר תגובות זריזות במיוחד בלי לאבד את יכולות הקריאה לכלים. לפי Sierra נרשמה עלייה של כ-20 אחוז בביצועי קריאות לכלים בעלי השהיה נמוכה לעומת GPT-5 במצב minimal.
  • קאשינג מורחב: prompt_cache_retention ל-24h, לטובת סשנים ארוכים כמו צ'אט רב-שלבי או תיקוני קוד. טוקני קלט שנשלפים מהקאש זולים ב-90 אחוז ללא חיוב נוסף על כתיבה או אחסון.

ביצועים ומדדים בולטים

  • Balyasny Asset Management דיווחה על ביצועים טובים יותר מול GPT-4.1 ו-GPT-5, תוך ריצה מהירה פי 2 עד 3 וחסכון של כ-50 אחוז בטוקנים במשימות עתירות כלים.
  • Pace דיווחה שהסוכנים שלהם רצים מהר יותר בכ-50 אחוז עם GPT-5.1 תוך שיפור דיוק לעומת GPT-5.
  • תוצאות אבן בוחן: SWE-bench Verified 76.3 אחוז, GPQA Diamond 88.1 אחוז, AIME 2025 94.0 אחוז, MMMU 85.4 אחוז. FrontierMath עם כלי Python 26.7 אחוז. בחלק מהמדדים GPT-5 נשאר מעט גבוה, אך המגמה הכללית מצביעה על קפיצה בשילוב מהירות ואמינות.

קידוד וסוכנים

  • פרסונות קוד משופרות, פחות overthinking ושדרוג ההסברים למשתמש בזמן קריאות לכלים. שותפים כמו Cursor, Cognition, Augment Code, Factory ו-Warp מציינים שיפור בפוקוס, ביעילות ובאמינות העריכות. Cline מדווחת על SOTA בבנצ'מרק עריכות דיפ עם שיפור של כ-7 אחוז. CodeRabbit בחרה ב-5.1 כמודל מוביל לביקורות PR. JetBrains מציינת יכולות סוכנות טבעיות וזרימה טובה ב-Responses API.
  • כלי apply_patch חופשי פורמט: המודל מפיק דיפים מובְנים ליצירה, עדכון ומחיקה של קבצים, מתאים לעבודה איטרטיבית רב-שלבית על בסיס קוד. אינו דורש JSON escaping.
  • כלי shell: המודל מציע פקודות מעטפת, האינטגרציה מריצה ומחזירה פלט בלולאת plan-execute פשוטה. שימושי לבדיקה, איסוף נתונים ואוטומציה מבוקרת.

זמינות, תמחור והטמעה

  • זמינות: GPT-5.1 וכלי gpt-5.1-chat-latest זמינים לכל המפתחים בתשלום ב-API, לצד gpt-5.1-codex ו-gpt-5.1-codex-mini למשימות קוד ארוכות טווח. אין כוונה מיידית להפסיק את GPT-5.
  • תמחור: זהה ל-GPT-5. לקוחות Priority Processing צפויים להרגיש שיפור ניכר במהירות.
  • הנחיות שימוש: ברירת המחדל reasoning_effort היא none לביצועים מהירים. מומלץ low או medium למשימות מורכבות יותר, ו-high כאשר אמינות גוברת על זמן תגובה. תמיכה בחיפוש רשת זמינה ב-API ומסייעת בעבודות איסוף מידע דינמיות.

נקודת מבט והקשר מעשי

הגישה האדפטיבית של GPT-5.1 מפחיתה עלויות וזמני המתנה בסביבות פרודקטיביות, במיוחד בסוכנים עסקיים, IDEs וזרימות DevOps. שילוב הקאשינג המורחב עם apply_patch ו-shell מאפשר סבבים קצרים של תכנון-ביצוע-בדיקה, שדרוג משמעותי לסביבות צוותים המפתחים במהירות ושואפים לאוטומציה בטוחה ומבוקרת.

שאלות נפוצות