
קרדיט תמונה: OpenAI
OpenAI משיקה את GPT-5.2-Codex: קפיצת מדרגה בסוכני קוד להנדסת תוכנה והגנת סייבר
לפי דיווח של OpenAI מהיום, הושק GPT-5.2-Codex, גרסה ייעודית למודל GPT-5.2 המותאמת להנדסת תוכנה בעולם האמיתי וליכולות סייבר הגנתיות. המודל מציג שיפורים בהבנת הקשר ארוך, ריפקטורינג ומיגרציות בקוד, עבודה אמינה בסביבות Windows, חזון טוב יותר ועמידה שיא בבנצ'מרקים כמו SWE-Bench Pro ו-Terminal-Bench 2.0.
לפי דיווח של OpenAI מהיום, החברה משיקה את GPT-5.2-Codex, מודל סוכן קוד מתקדם שמבוסס על GPT-5.2 ומכויל למשימות הנדסת תוכנה מורכבות וליכולות סייבר הגנתיות. המודל זמין כבר היום למשתמשי ChatGPT בתשלום בממשקי Codex, ובעוד מספר שבועות צפוי להיפתח גם דרך ה-API. במקביל, OpenAI מפעילה פיילוט גישה אמינה ומוזמנת בלבד למקצועני סייבר vetted לצרכי הגנה.
מה חדש ומה בולט
- ביצועים ארוכי טווח: שיפור בהבנת הקשר ארוך, קריאות כלים אמינות יותר ושיטות compaction מובְנות שומרות על רצף עבודה יציב וחסכוני בטוקנים, גם לאורך סשנים ממושכים וריבוי נסיונות.
- שינויים בקוד בקנה מידה גדול: המודל מותאם לריפקטורינג, מיגרציות ובניית פיצ'רים מורכבים בריפו גדולים, תוך שמירה על עקיבות תוכניתית גם כאשר התוכניות משתנות.
- תמיכה חזקה ב-Windows: יכולות agentic בסביבות Windows שופרו משמעותית לעומת דורות קודמים.
- חזון משופר: הבנה טובה יותר של צילומי מסך, תרשימים, דיאגרמות ו-UI, כולל המרה מהירה של עיצובי mockup לאבי טיפוס תפקודי.
- ביצועי שיא בבנצ'מרקים: המודל מציג סטנדרט חדש ב-SWE-Bench Pro וב-Terminal-Bench 2.0. הבנצ'מרקים הללו בוחנים ביצועי סוכנים בסביבת טרמינל אמיתית במשימות כמו קומפילציה, אימון מודלים והקמת שרתים, לצד יצירת פאטצ'ים לפתרון באגים בריפוזיטוריז פתוחים.
היבטי סייבר והפחתת סיכונים
- שדרוג יכולות: OpenAI מדווחת על קפיצת יכולת רציפה מאז GPT-5-Codex, דרך GPT-5.1-Codex-Max ועד GPT-5.2-Codex. אף שהמודל לא מסווג כרגע כ"High" לפי מסגרת ה-Preparedness של החברה, הוטמעו אמצעי זהירות ומדיניות מוצר מחמירים, לרבות System Card ייעודי.
- מקרה בוחן: אנדרו מקפרסון, מהנדס אבטחה ראשי ב-Privy (חברת Stripe), השתמש ב-GPT-5.1-Codex-Max יחד עם Codex CLI כדי לשחזר ולחקור את React2Shell (CVE-2025-55182). בתהליך ההעתקה ההגנתי נחשפו התנהגויות חריגות שהובילו לגילוי פגיעויות נוספות ב-React Server Components, שדווחו באחריות ותקנו. המקרה מדגים כיצד מערכות Agentic יכולות להאיץ מחקר פגיעויות הגנתי בתוכנה נפוצה.
- הערכה מקצועית: ביצועי המודל נמדדים גם ב-Professional CTF eval בסביבת Linux, הבוחנת פתרון אתגרים רב-שלביים ברמה מקצועית. היעד של OpenAI הוא לאזן בין נגישות לבין בטיחות, תוך הכנה למודלים עתידיים בעלי יכולת גבוהה יותר.
זמינות, כלים ומסלול גישה אמינה
- זמינות כללית: GPT-5.2-Codex זמין למשתמשי ChatGPT בתשלום בממשקי Codex, וגישה דרך ה-API צפויה בשבועות הקרובים.
- Trusted Access: פיילוט מוזמן בלבד יאפשר לאנשי מקצוע עם היסטוריית גילוי אחראי ולארגונים בעלי שימושי סייבר הגנתיים לקבל מודלים חזקים יותר לשימושים הגנתיים מובהקים.
- התחלת עבודה למפתחים: OpenAI מציינת תקנת התקנה לכלי ה-CLI של Codex באמצעות npm i -g @openai/codex, לשילוב מהיר בסביבת הפיתוח ותהליכי CI.
למה זה חשוב
העומק הטכני של GPT-5.2-Codex נותן למפתחים שותף סוכן המסוגל לנווט בקוד מורכב לאורך זמן, לבצע שינויים רוחביים בבטחה ולהמיר עיצוב לפונקציונליות במהירות. בתחום הסייבר, ההאצה בתהליכי גילוי, אימות ותיקון פגיעויות עשויה לחזק משמעותית את החוסן של מערכות קריטיות בבנקאות, בריאות ותקשורת, כל זאת תחת מדיניות גישה זהירה שמטרתה לצמצם שימוש לרעה.
