חזרה לחדשות
GPT-5 סייע לפרופ' ארנסט ריו לפתור חידה בת 40 שנה: למה האצת נסטרוב יציבה כל כך

קרדיט תמונה: OpenAI

GPT-5 סייע לפרופ' ארנסט ריו לפתור חידה בת 40 שנה: למה האצת נסטרוב יציבה כל כך

25 בנובמבר 2025
מערכת זירת AI

לפי דיווח של OpenAI, פרופ' ארנסט ריו מאוניברסיטת UCLA השתמש ב-GPT-5 כשותף חקר מהיר וגמיש כדי לאתר מבנה מתמטי שסלל את הדרך להוכחה המסבירה כיצד האלגוריתם Nesterov Accelerated Gradient מצליח לשלב מהירות ויציבות. בתוך כ-12 שעות נטו על פני שלושה ימים, ריו גיבש הוכחה, פרסם קדם-דפוס ב-arXiv, והדגיש: הבינה המלאכותית תרמה רעיונות אך אינה מחליפה בדיקה מתמטית קפדנית.

לפי דיווח של OpenAI, אתמול פורסם כי GPT-5 סייע לפרופ' ארנסט ריו מאוניברסיטת UCLA לפתור בעיה פתוחה בת 40 שנה באופטימיזציה: מדוע האצת נסטרוב Nesterov Accelerated Gradient מצליחה להאיץ התכנסות בלי לפגוע ביציבות.

  • הבעיה: NAG, שפותחה ב-1983 בידי יורִי נסטרוב, מוסיפה רכיב "מבט קדימה" שמחשב את הגרדיאנט בנקודת חיזוי ולא רק במיקום הנוכחי. במשך עשורים נצפתה האצה דרמטית ללא פגיעה ניכרת ביציבות, אך ההסבר התאורטי המלא לא נסגר.
  • הפריצה: GPT-5 הציע לריו דרך לארגון מחדש של המשוואות המתארות את NAG. ההצעה לא הייתה נכונה כפי שנכתבה, אך המבנה שהבליטה הוביל את ריו לפתח שלד הוכחה וללטש אותו עד פתרון מלא. ריו ביצע את הפיתוח והוולידציה בעצמו.

מה קרה מאחורי הקלעים

  • קצב חקירה מהיר: ריו תיאר אינטראקציה אינטנסיבית בת כ-12 שעות נטו על פני שלושה ימים, עם כמעט תריסר כיוונים שונים. ה-LLM שימש כמנוע יצירת וריאציות, רעיונות מכלי משנה סמוכים, וסינון אפשרויות בקצב מהיר.
  • אימות קפדני: ריו גילה כי פתיחת שיחה חדשה לבדיקת כל שלב מקטינה טעויות מצטברות. למרות ש-GPT-5 הפיק טיעונים שנראו סבירים אך היו לעיתים שגויים, תפקידו המרכזי היה הצעת נתיבים, בעוד ריו הכריע מה מבטיח ומה מבוי סתום.
  • קרדיט ואתיקה: ה-GPT-5 מוזכר בכותרת ובתקציר המאמר כתרומת כלי משמעותי, אך אינו מופיע כשותף-מחבר. ריו מדגיש כי מדובר בשימוש בכלי, לא ביוצר קוגניטיבי עצמאי.

למה זה חשוב

  • השפעה מדעית ומעשית: יציבות תחת תאוצת נסטרוב היא סוגיה מרכזית בהנדסה, למידה חישובית ואופטימיזציה קמורה ולא-קמורה. הבהרת המנגנון מאפשרת כיוונון אמין של פרמטרים כמו צעד למידה ומומנטום, ומסייעת לצמצם בזבוז משאבים חישוביים.
  • קישור לעולם ה-ML: וריאציות של מומנטום נסטְרוֹב נמצאות בספריות כמו PyTorch ו-TensorFlow, ולעיתים משולבות באופטימייזרים מודרניים. הבנה תאורטית משופרת מאפשרת בחירה שקולה בין שיטות כמו SGD עם נסטְרוֹב, Heavy-ball ואלגוריתמים מואצים אחרים.

מתודולוגיית עבודה עם LLM במחקר מתמטי

  • ריו ממליץ על תהליך איטרטיבי: לשאול שאלות ממוקדות, לטייב רעיון מבטיח, לפתוח שיחות חדשות לבקרה, ולבצע בדיקות ידניות קפדניות.
  • התועלת המרכזית: הרחבת מרחב הרעיונות בקצב גבוה דרך שילוב כלים מעולמות סמוכים, תוך הישענות על אינטואיציה מתמטית אנושית להכריע.

פרטים נוספים

  • החוקרים: פרופ' ארנסט ריו (UCLA); השיטה נולדה מעבודתו של יורִי נסטרוב.
  • פרסום: קדם-דפוס זמין ב-arXiv ומתקדם לביקורת עמיתים. קישור: https://arxiv.org/abs/2510.23513

בשורה התחתונה, כך עולה מהפרסום של OpenAI: כאשר מומחיות אנושית פוגשת מודל חזק כמו GPT-5, מתקבל מאיץ לרעיונות שמקצר משמעותית את הדרך בין ניסוי, טעייה, וחידוד הוכחה מתמטית. ריו מסכם כי ישתמש בכלי בקביעות במחקרו, אך תמיד בצמוד לבקרה אנושית בלתי מתפשרת.

שאלות נפוצות