חזרה למחקרים
תחנת פיקוד ובקרה לרחפן שנוצרה על ידי AI ומאוחסנת באוויר |
npj Artificial Intelligence
רובוטיקה חכמה

תחנת פיקוד ובקרה לרחפן שנוצרה על ידי AI ומאוחסנת באוויר |

מחברים:Peter J. Burke
תאריך פרסום:14 באפריל 2026
סוג המחקר:ניסוי אמפירי
מקור:npj Artificial Intelligence

יישומי המאמר

המחקר מראה שבינה מלאכותית יכולה לקצר דרמטית את זמן הפיתוח של מערכות שליטה לרחפנים — ממשנים של עבודה לצוותים אנושיים, לשבועות בודדים. עבור ארגונים, המשמעות היא יכולת להקים מהר יותר מערכות פיקוד, ניטור ותפעול לרחפנים בתחומי אבטחה, לוגיסטיקה, חקלאות, תשתיות וחירום. במקום תוכנה כבדה שדורשת מחשב ייעודי והתקנה מקומית, מתקבלת תחנת שליטה מבוססת דפדפן שנגישה מכל מקום, גם מטאבלט או סמארטפון. עוד תובנה חשובה לעולם העסקי היא שה-AI לא רק כתב קוד, אלא גם הציע ארכיטקטורה מעשית, UI ושיפורים פונקציונליים. עם זאת, המחקר גם מזהיר שלא מדובר עדיין בתחליף מלא להנדסת תוכנה או לאימות בטיחותי: בפרויקטים מורכבים יותר עדיין יש מגבלות של זיכרון, בדיקות ואמינות. לכן השימוש המיידי הוא בעיקר כהאצה דרמטית של פיתוח ואב-טיפוס, ולא כתחליף מלא לתהליכי ולידציה הנדסיים.

TL;DR

המאמר מציג הוכחת היתכנות מרשימה לכך שמודלי שפה גדולים יכולים לכתוב מאפס מערכת שלמה לפיקוד ובקרה על רחפן, בלי שאדם יכתוב אפילו שורת קוד אחת. המחקר התמקד ב-WebGCS — תחנת שליטה מבוססת דפדפן שמתקשרת עם הרחפן דרך MAVLink, מציגה טלמטריה בזמן אמת, מפה אינטראקטיבית ופקודות כמו חימוש, המראה, נחיתה, חזרה לנקודת המוצא וטיסה לנקודה נבחרת. מעבר לכך, המערכת הותקנה גם על מחשב מלווה שעל הרחפן עצמו, כך שהרחפן אירח “אתר אינטרנט באוויר”. הפיתוח בוצע בכמה ספרינטים תוך שימוש ב-Claude, Gemini, ChatGPT, Cursor ו-Windsurf, ונמשך כ-100 שעות אדם בלבד עבור בסיס קוד של כ-10,000 שורות וכ-120 commits. בהשוואה לגרסה ידנית קודמת דומה שדרשה כ-2,000 שעות, המחקר מצביע על האצה של בערך פי 20. עם זאת, הוא גם מדגיש מגבלות ברורות של חלון הקשר, זיכרון מודל, ריפקטורינג ותיקון תלויות בין קבצים בפרויקטים גדולים.

פירוט המאמר

מבוא

המאמר בוחן שאלה שאפתנית: האם בינה מלאכותית גנרטיבית יכולה לכתוב בפועל את “המוח הביניים” של רחפן — כלומר תחנת פיקוד ובקרה (Ground Control Station, או GCS) — מבלי שאדם יכתוב קוד? המחבר ממקם את המחקר בין שכבת הקושחה הנמוכה של בקר הטיסה, כמו Ardupilot או PX4, לבין שכבת האוטונומיה הגבוהה יותר דוגמת ROS2. לטענתו, כתיבת שכבות אלה עדיין גדולה מדי עבור מודלים עדכניים, אך שכבת ה-GCS היא יעד ריאלי: מערכת שמקבלת טלמטריה, מציגה מיקום על מפה, ומאפשרת פקודות כמו המראה, נחיתה, טיסה לנקודות ו-Return-to-Launch.

מטרות המחקר

המאמר מציג שני הישגים מרכזיים. הראשון הוא תהליך פיתוח שבו AI יוצר מאפס מערכת WebGCS מלאה עם מינימום קלט אנושי וללא כתיבת קוד אנושית. השני הוא הארכיטקטורה עצמה: לא רק תחנת שליטה מבוססת-ווב על הקרקע, אלא גם פריסה שלה על גבי מחשב מלווה על הרחפן, כך שהרחפן מארח את אתר השליטה “באוויר”. בכך מודגם לראשונה, לפי המחבר, “אתר אינטרנט באוויר” שמאפשר שליטה דרך דפדפן בלבד.

תהליך הפיתוח: ספרינטים, מודלים וכלים

הפיתוח התקדם בשלושה שלבים עיקריים. בשלב הראשון נעשה שימוש בחלונות צ'אט בלבד, עם העתק-הדבק של קוד שהמודל יצר. ספרינט 1 בוצע ב-Claude עם חלון הקשר של כ-200k tokens. הוא הצליח לייצר אב-טיפוס בסיסי, ואף הציע עצמאית פיצ'רים כמו geofencing ו-return-to-home, אך נתקע עקב מגבלת context באזהרה ש"השיחה הגיעה לאורך המקסימלי". התוצר לא היה מספיק בשל לטיסת מבחן. שלב זה הוערך בכ-16 שעות אדם.

בספרינט 2 נעשה שימוש ב-Gemini 2.5 עם חלון של עד 1M tokens. המחקר מדווח בפועל על חמישה חלונות הקשר, כל אחד סביב 500k tokens, משום שמעבר לכך המודל החל “לשכוח” את תחילת השיחה. בכל חלון היו כ-25 prompts, שרובם עסקו בתיקון באגים שהתגלו בהרצה ובהתקנה. בשלב זה הושגה מערכת שמסוגלת לעלות על Raspberry Pi ולבצע טיסת מבחן ראשונה, אך עדיין היו כשלים, למשל עדכון לא תקין של מיקום על המפה. שלב זה ארך לפי ההערכה כ-30 שעות אדם.

בשלב השני של המחקר, ספרינט 3, הפיתוח עבר ל-Cursor IDE. המעבר ל-IDE אפשר ל-AI לעבוד מול בסיס קוד רב-קבצים במקום קובץ shell ענק יחיד. כאן הושגה לראשונה טיסה מוצלחת מלאה עם פונקציות כמו שינוי מצבים, המראה, נחיתה, RTL, הצגת מיקום בזמן אמת, חימוש/נטרול, ולחיצה על מפה כדי לשלוח את הרחפן לנקודה. למרות זאת, המחבר מדווח על קושי של ה-LLMs להבין תלות בין קבצים ואת זרימת המידע מהרחפן, דרך ה-backend, אל ה-frontend וחזרה. ספרינט זה כלל כ-30 שעות אדם, כ-35 אלף “lines of agent” ו-51 commits ב-GitHub.

בשלב השלישי, ספרינט 4, נעשה שימוש ב-Windsurf IDE עם גישה סוכנותית יותר. כאן גובשה גישת self-test coding: המודל קיבל משימה פונקציונלית והמשיך לשנות את הקוד עד שהבדיקה עברה, מה שהקטין התערבות אנושית. בשלב זה נוספו פיצ'רים כמו התראות קוליות ובחירת כתובת IP דרך הממשק. הספרינט כלל כ-30 שעות אדם, כ-14 אלף שורות קוד שנכתבו או שוכתבו, ו-41 commits. לאחר ספרינט סופי נוסף של כ-8 שעות ו-44 commits נוספים הושגה גרסת 2.0 המלאה. בסך הכול: כ-100 שעות אדם, 120 commits, וכ-10,000 שורות קוד במערכת הסופית.

הארכיטקטורה של המערכת

ה-AI בחר בעצמו ארכיטקטורת three-tier: ממשק משתמש בדפדפן, שרת backend בשם WebGCS, ורחפן פיזי. ה-frontend נכתב ב-HTML/CSS/JavaScript ומשתמש ב-Leaflet.js להצגת מפה חיה ו-Socket.IO לערוץ דו-כיווני בזמן אמת. ה-backend נכתב ב-Python עם Flask, Flask-SocketIO ו-Gevent, ומתקשר עם הרחפן דרך PyMAVLink בפרוטוקול MAVLink על TCP. המערכת מזרימה טלמטריה לדפדפן בזמן אמת ומתרגמת פעולות משתמש להודעות MAVLink. המחבר מציין שהבחירה הזו הייתה טובה מאוד עבור רחפן יחיד, אף שאינה אידיאלית לסקייל של אלפי רחפנים.

ממשק משתמש ופונקציונליות

ממשק הטייס כלל מפה, תצוגת HUD, תצוגות טלמטריה וכפתורי שליטה. באופן מעניין, ה-AI הוסיף ביוזמתו HUD, אף שהאדם ביקש רק מפה וכפתורים. המערכת תמכה בעדכון מיקום בזמן אמת, חימוש, המראה, נחיתה, חזרה לנקודת המוצא, וטיסה לנקודה שנבחרה על המפה. בהמשך נוספו גם לוגים ותיקונים קוסמטיים ופונקציונליים.

ניסויי טיסה, סימולציה ובטיחות

ההדגמה בוצעה על רחפן תת-250 גרם, עם Raspberry Pi Zero 2 W כמחשב מלווה המחובר דרך UART לבקר טיסה Matek F405 Wing, ועליו Ardupilot. ה-WebGCS רץ על ה-Raspberry Pi, והמחשב הנייד של המפעיל התחבר ל-WiFi hotspot שיצר הרחפן. הקישור היה יציב עד 100 מטר — המרחק המקסימלי שנבדק. ברצף הטיסה המוצלח בוצעו: Arm, Takeoff, טיסה לנקודה על המפה, ו-Return to Launch. בטיסות הסופיות לא נעשה שימוש כלל בשלט הגיבוי.

המחקר מדווח על שני באגים שהתגלו בטיסות מוקדמות: במקרה אחד מיקום הרחפן לא עודכן על המפה, ובמקרה אחר פקודת ההמראה לא עבדה. דו"חות הבאגים הוזנו ל-AI, והוא תיקן את הקוד. לפי המחבר, בגרסה 2.0 לא היו באגים ידועים. בנוסף, פותח פרוטוקול סימולציה בענן שאפשר בדיקות רציפות על רחפן וירטואלי. מבחינת בטיחות, הטיסות בוצעו מעל שדה פתוח ללא אנשים, עם שלט גיבוי זמין ועם geofence קשיח בתוכנה.

השוואה לפיתוח ידני ומדדי יעילות

המחבר משווה את המערכת לפרויקט CloudStation הידני שפותח לאורך כ-4 שנים וכלל ארבע גרסאות עיקריות. להערכתו, הפיתוח הידני דרש כ-2,000 שעות עבודה מצטברות, לעומת כ-100 שעות בלבד במחקר הנוכחי — שיפור של בערך פי 20. הוא גם מביא אומדן לפי מודל COCOMO II: עבור מערכת בגודל 14k lines of code, הפיתוח המסורתי היה מוערך בכ-93 person-months, כלומר כ-14,000 שעות, אם כי הוא מודה שזה גבוה משמעותית מהפיתוח הידני האקדמי ולכן מהווה בעיקר נקודת ייחוס תעשייתית ולא השוואה ישירה.

דיון, מגבלות ומשמעות רחבה

הטענה המרכזית של המאמר היא ש-LLMs כבר מסוגלים לכתוב קוד תפעולי לרובוטים, לפחות בשכבת ביניים כמו GCS, אך הם מוגבלים בגודל בסיס הקוד שאותו הם יכולים להבין, לתחזק ולרפקטור. הניסיון המעשי במחקר מצביע על סף של בערך 10k שורות קוד כגבול עליון מעשי, כאשר שינויים קטנים מקומיים עובדים היטב, אך שינויים שדורשים הבנה מערכתית של תלות בין מודולים גורמים לשגיאות ולרגרסיות. המחבר קושר זאת גם לספרות חדשה שמראה ירידה חדה בדיוק מודלים כאשר חלון ההקשר מתארך.

מסקנות

המאמר מסיק כי כיום כבר אפשרי להשתמש ב-AI לכתיבת קוד רחפנים ולהטיס בפועל מערכת שנכתבה כולה על ידי מכונה. התרומה היא כפולה: גם הדגמה מעשית של תהליך פיתוח מואץ מאוד, וגם הדגמת ארכיטקטורה חדשה של תחנת שליטה מבוססת ווב שמותקנת על הרחפן עצמו. עם זאת, המחקר גם מדגיש שהמגבלות הנוכחיות של חלון הקשר, זיכרון, ריפקטורינג, סקייל ואימות בטיחותי מונעות בשלב זה מעבר לבסיסי קוד גדולים בהרבה כמו ROS2 או Ardupilot. לכן מדובר בעיקר באבן דרך ראשונה ומשמעותית בכיוון של “מכונות שבונות את מוחם של רובוטים”.

✨ היילייטס

  • הדגמה ראשונה של תחנת פיקוד ובקרה לרחפן שנכתבה כולה על ידי AI: המחקר מציג מערכת WebGCS שבה לא נכתבה אפילו שורת קוד אחת בידי אדם, כולל frontend, backend, סקריפטי התקנה וארכיטקטורת המערכת.
  • פריסה חדשנית של “אתר אינטרנט באוויר”: מעבר לתחנת שליטה וובית רגילה, המערכת הותקנה על Raspberry Pi שעל הרחפן עצמו, כך שהרחפן אירח את ממשק השליטה דרך WiFi hotspot, ונשלט דרך דפדפן בלבד.
  • האצה דרמטית בפיתוח: המערכת פותחה בכ-100 שעות אדם, עם כ-120 commits וכ-10,000 שורות קוד, לעומת פרויקט ידני דומה קודם של המחבר שנאמד בכ-2,000 שעות — שיפור של בערך פי 20 ביעילות.
  • טיסות אמת הוכיחו פונקציונליות מבצעית בסיסית: בגרסה הסופית בוצעו בהצלחה חימוש, המראה, טיסה לנקודה על המפה, ו-Return to Launch, כאשר בטיסות הסופיות לא נעשה שימוש כלל בשלט הגיבוי.
  • המגבלה המרכזית כיום היא גודל ההקשר והבנת תלויות מערכתיות: המאמר מראה שבסיס קוד של בערך 10k שורות כבר נמצא סמוך לגבול היכולת המעשית של LLMs בפיתוח, תחזוקה וריפקטור של מערכות רב-קבצים מורכבות.

חוקרים

Peter J. Burke

מילות מפתח

רובוטיקה חכמהמודלים גדוליםבינה מלאכותית גנרטיביתאינטגרציה ארגונית ותעשייתית של AIקבלת החלטות עם AI

שאלות נפוצות