
בינה מלאכותית משדרגת ראייה אלחוטית שמזהה עצמים וחדרים מאחורי מכשולים
לפי דיווח ב MIT חדשות, חוקרים הצליחו לשלב מודלים גנרטיביים עם אותות mmWave (דמויי Wi‑Fi) כדי להשלים צורות חסרות של עצמים מוסתרים ואף לשחזר חדרים שלמים מרדאר סטטי, בדיוק גבוה יותר ובשמירה על פרטיות.
על-פי הדיווח, חוקרי MIT מציגים קפיצת מדרגה ב"ראייה אלחוטית" המאפשרת לרובוטים ולמערכות חכמות להבין מה נמצא מאחורי מכשולים, לא באמצעות מצלמה אלא באמצעות אותות אלחוטיים שחודרים חומרים נפוצים ומוחזרים מהסביבה. החידוש המרכזי: שימוש בבינה מלאכותית גנרטיבית כדי להשלים מידע חסר בשחזורים תלת ממדיים ולתרגם החזרי אותות רועשים לתמונה שימושית של עצמים וחדרים.
למה בכלל צריך ראייה דרך עצמים וקירות?
במחסנים, במפעלים ובתשתיות, חיישנים אופטיים נתקלים במהירות בתקרת זכוכית: קרטונים, קירות גבס, אריזות או רהיטים מסתירים את מה שהמערכת צריכה לזהות. כאן נכנסים לתמונה גלי מילימטר (mmWave), אותם גלים שמזוהים עם תקשורת Wi‑Fi ועם מערכות מכ"ם קצרות טווח. גלים כאלה יכולים לעבור דרך חומרים כמו קרטון, פלסטיק ולעיתים גם גבס, ולהחזיר "הדים" שמכילים רמזים על העצמים שמעבר למחסום.
רוצה להישאר מעודכן ב-AI?
הירשם לדיוור השבועי שלנו וקבל עדכונים, המלצות על כלים, חדשות ודוחות מיוחדים
הבעיה היא שההחזר אינו תמיד אינפורמטיבי. בשל תופעת החזרה ספקולרית (כמו מראה), חלק גדול מפני השטח של עצם מחזיר את הגל לכיוון אחר, כך שהחיישן "רואה" רק שברים מהצורה. לרוב מתקבל מידע בעיקר על החלק העליון, בעוד הצדדים והתחתית כמעט בלתי נראים.
Wave-Former: AI שממלא את החסר בשחזור תלת-ממדי
במאמר הראשון, פרופ' פאדל אדיב , מנהל קבוצת Signal Kinetics ב MIT Media Lab, יחד עם לורה דודס, מייזי לאם , וליד אכבר ויבו צ'נג, מציגים מערכת בשם Wave-Former. המערכת מתחילה משחזור חלקי שמבוסס על החזרי mmWave, לאחר מכן מפעילה מודל גנרטיבי שמציע השלמות סבירות לצורה, ולבסוף מחדדת את ההשערות עד לקבלת שחזור מלא.
אחת התרומות המעניינות היא הדרך לאמן מודל גנרטיבי כשאין מאגר נתונים ענק של "הדים" אלחוטיים. החוקרים התאימו מאגרי נתונים חזותיים קיימים כך שידמו את תכונות ההחזר הספקולרי והרעש של mmWave, והטמיעו בתוך הדאטה הסינתטי את הפיזיקה של ההשתקפויות. התוצאה: שיפור דיוק של כמעט 20% ביחס לשיטות מובילות, בשחזור של כ-70 עצמים יומיומיים, כולל קופסאות, קופסאות שימורים וכלי מטבח, שהוסתרו מאחורי קרטון, עץ, גבס, פלסטיק ובד.
RISE: שחזור חדר שלם בעזרת רדאר סטטי ותנועת אנשים
במאמר השני מציגים אדיב והצוות, בהובלת ד"ר קאיצ'ן ג'ואו ובהשתתפות דודס וסאייד סעד אפזל, מערכת בשם RISE שמרחיבה את הרעיון לשחזור של סצנה פנימית שלמה. במקום לסרוק עם חיישן על רובוט נע, המערכת משתמשת ברדאר mmWave סטטי יחיד ומנצלת תופעה שמרבית המערכות מנסות להיפטר ממנה: החזרי רב מסלול.
כאשר אדם נע בחדר, חלק מהגלים מוחזרים ממנו ואז מקפצים שוב מקיר או מרהיט וחוזרים לחיישן. ההחזרים המשניים הללו יוצרים "אותות רפאים" שמשתנים עם התנועה. במקום לסנן אותם כרעש, RISE לומדת לפרש אותם כדי להסיק היכן נמצאים קירות ורהיטים, ואז מודל גנרטיבי משלים את הפרטים החסרים. בניסוי על יותר מ-100 מסלולי תנועה אנושיים, RISE השיגה שחזור מדויק בערך פי שניים לעומת שיטות קיימות.
משמעות תעשייתית: רובוטים חכמים יותר, ופרטיות טובה יותר
היישומים האפשריים ברורים: רובוטים במחסן יוכלו לאמת תכולת אריזה ללא פתיחה, להפחית החזרות ובזבוז; רובוט ביתי יוכל להבין מיקום של אדם בחדר כדי לנוע בבטחה; ובמרחבים רגישים, מדובר בפתרון שעשוי לשמר פרטיות טוב יותר ממצלמות, משום שהמערכת נשענת על החזרי אותות ולא על תמונות פנים.
לדברי אדיב, השילוב בין פיזיקה של גלים למודלים גנרטיביים הוא "קפיצה איכותית" שמקרבת את התחום ל"מודלי יסוד" עבור אותות אלחוטיים, בדומה למה ש GPT ודומיהם עשו לטקסט ולתמונה. אם המגמה הזו תימשך, ראייה אלחוטית עשויה להפוך מניסוי מעבדה לכלי תשתיתי באוטומציה, רובוטיקה ובתים חכמים.
