מחקרי AI

מחקרים אקדמיים עדכניים בתחום הבינה המלאכותית בעברית. סיכומים, הסברים, פרשנות ודוגמאות שימוש פרקטיות בחיי היום יום ובעולם העסקי

מציג 162 מתוך 162 מחקרים
הוכחת היתכנות לאבחון מחלות בר‑הסבר באמצעות מודלים לשוניים גדולים (LLMs) ו‑Answer Set Programming (ASP)
arXiv
בינה מלאכותית רפואית ובריאות דיגיטלית

הוכחת היתכנות לאבחון מחלות בר‑הסבר באמצעות מודלים לשוניים גדולים (LLMs) ו‑Answer Set Programming (ASP)

29 בדצמבר 2025

המחקר מציע דרך לשלב בין מודלי שפה גדולים כמו ChatGPT לבין לוגיקה פורמלית על מנת להפיק אבחנות רפואיות מוסברות ושקופות. במקום להסתמך רק על "קופסה שחורה" סטטיסטית, המסגרת משתמשת ב‑LLM כדי לפענח טקסטים קליניים, ולתרגם אותם לעובדות מובנות (סימפטומים, תוצאות בדיקות, מחלות רקע). על בסיס עובדות אלו פועל מנוע לוגי (Answer Set Programming) שמיישם כללי ידע רפואי ברורים, ניתנים לעריכה ולביקורת, ומפיק אבחנה והסבר: למה מחלה מסוימת מתאימה או נשללת, אילו ממצאים תומכים בה, ואילו חוקים הופעלו. עבור מנהלים במערכות בריאות, המשמעות היא פוטנציאל לפיתוח מערכות תומכות החלטה קליניות שמחזקות אמון: הקלינאי רואה לא רק מה ההמלצה, אלא גם את מסלול ההסקה. עבור חברות טכנולוגיה רפואית, הגישה מאפשרת לבנות שירותי AI רפואי עם בקרה רגולטורית קלה יותר, מכיוון שהחוקים הרפואיים גלויים, ניתנים לעדכון, ואינם טמונים במיליוני פרמטרים בלתי שקופים.

Ioanna Gemou ו-Evangelos Lamprou
קרא עוד ←
SPARK: התאמה אישית של החיפוש באמצעות אחזור מונחה‑סוכן (Agent‑Driven Retrieval) ושיתוף ידע
arXiv
למידה חישובית

SPARK: התאמה אישית של החיפוש באמצעות אחזור מונחה‑סוכן (Agent‑Driven Retrieval) ושיתוף ידע

29 בדצמבר 2025

SPARK מציע דרך פרקטית להפוך מערכות חיפוש ו‑LLM לכלים אישיים באמת, שמתאימים את התשובה לסגנון ולצרכים של כל משתמש. במקום צ'אטבוט כללי שנותן תשובות "ממוצעות", ניתן להגדיר לכל עובד/לקוח סוכן מותאם על בסיס תפקיד (למשל: אנליסט נתונים, עו"ד, רופא), רמת מומחיות, תחום פעילות והקשרים אופייניים (מסמכים ארגוניים, קוד, נהלים). הסוכן הזה מנהל גם את החיפוש במקורות המידע: הוא יודע אילו מאגרים רלוונטיים, איך לנסח שאילתות טוב יותר לכל מקור, ואיך לשלב תוצאות בצורה עקבית. עבור ארגונים, המשמעות היא חיפוש פנימי וחיצוני מדויק יותר, הפחתת זמן למציאת מידע קריטי, ושיפור באיכות ההחלטות – למשל בניתוח שווקים, מחקר משפטי, תמיכה טכנית או ניהול ידע. עבור מוצרים צרכניים, ניתן לבנות חוויית "עוזר אישי" שמתאים עצמו לאורך זמן למשתמש, שומר עקביות בהמלצות, ומסביר החלטות על בסיס ידע שנשלף בצורה מושכלת.

Gaurab Chhetri ואח'
קרא עוד ←
ROAD: אופטימיזציה רפלקטיבית באמצעות ניפוי שגיאות אוטומטי (Debugging) ליישור סוכנים ב-Zero‑Shot
arXiv (preprint)
מודלים גדולים

ROAD: אופטימיזציה רפלקטיבית באמצעות ניפוי שגיאות אוטומטי (Debugging) ליישור סוכנים ב-Zero‑Shot

29 בדצמבר 2025

המחקר מציע דרך ישימה לשיפור ביצועים ויישור של מערכות מבוססות מודלי שפה גדולים הפועלות כסוכנים – למשל צ'טבוטים תפעוליים, עוזרי פיתוח, מערכות אוטומציה עסקית או תהליכי אורקסטרציה בין כלים. במקום להשקיע בהמון דוגמאות ידניות, איסוף לוגים מסיבי או אימון מודלים חדשים, ROAD מאפשר לארגון להריץ את המערכת על סביבה אמיתית או סימולטיבית, לזהות באופן אוטומטי היכן היא נכשלת, ולבנות "תיקוני פרומפט" שמגבירים את אחוזי ההצלחה לאורך זמן. התוצאה היא תהליך שיפור מחזורי: הסוכן מוצב בסביבה, ROAD מאתרת דפוסי כשל, מייצרת הנחיות/מבני פרומפט חדשים, בודקת אותם, ומשמרת רק את אלה שמוכיחים עצמם על סט רחב של דוגמאות. עבור מנהלים, המשמעות היא יכולת ליישם סוכני LLM במערכות קריטיות (שירות לקוחות, תפעול, אינטגרציה בין מערכות) עם פחות סיכונים, זמן כיול קצר יותר, ויכולת שיפור מתמשכת ללא עבודה ידנית כבדה של צוותי פיתוח ו-ML.

Natchaya Temyingyong ואח'
קרא עוד ←
CASCADE: יצירה מצטברת של כישורים סוכניים (Agentic) באמצעות פיתוח ואבולוציה אוטונומיים
arXiv
מודלים גדולים

CASCADE: יצירה מצטברת של כישורים סוכניים (Agentic) באמצעות פיתוח ואבולוציה אוטונומיים

28 בדצמבר 2025

המחקר מציג דרך להפוך מודלי שפה גדולים וסוכני AI ממנגנונים סטטיים לכלי עבודה שמתפתחים כל הזמן. במקום להסתמך רק על מה שהמודל למד בזמן האימון, CASCADE מאפשרת לסוכן ללמוד כישורים חדשים תוך כדי עבודה: לחפש במאמרים, להוציא מהם קוד או כלים, לבדוק אותם על בעיות אמיתיות, ולשמור רק את מה שעובד טוב. כך, עם הזמן, נוצרת ספרייה גדלה והולכת של כישורים וכלי תוכנה שהסוכן יודע להפעיל באופן אוטונומי. מבחינת ארגונים, המשמעות היא שניתן לבנות סוכני AI שיודעים להעמיק בתחומים ספציפיים (למשל כימיה, אנליטיקת נתונים, ביוטק או פיננסים), להשתפר מעצמם ללא צורך בכל פעם בצוות פיתוח, ולהאיץ תהליכי מחקר, פיתוח והחלטה. CASCADE גם תומך בשקיפות טובה יותר, דרך גרפים של כישורים והסברים, כך שניתן להבין טוב יותר מה המערכת "למדה" ואיך היא פועלת.

Xu Huang ואח'
קרא עוד ←
מבחן Drill-Down and Fabricate (DDFT): פרוטוקול למדידת חוסן אפיסטמי במודלי שפה
arXiv
מודלים גדולים

מבחן Drill-Down and Fabricate (DDFT): פרוטוקול למדידת חוסן אפיסטמי במודלי שפה

28 בדצמבר 2025

המחקר מציע מסגרת פרקטית כדי לבדוק האם מודלי שפה גדולים (כמו צ'אטבוטים ומערכות עזר מבוססות AI) באמת "מבינים" את הידע שהם מפיקים, או רק מחקים תבניות טקסט. עבור מנהלים, מפתחים וגופי רגולציה, DDFT מספק ערכת מבחנים שמאפשרת להעריך: 1. עד כמה המודל שומר על דיוק ועקביות כששואלים אותו באופנים שונים, ברמות פירוט שונות ובסגנונות ניסוח מגוונים. 2. עד כמה הוא נוטה "להמציא" עובדות ולהיגרר אחרי טקסטים מזויפים אבל נראים אמינים. יישום הפרוטוקול לפני הטמעה בייצור יכול לסייע בבחירת מודל מתאים לפי תחום (רפואה, משפט, חינוך, קוד), לקבוע רמות אמון והגבלות שימוש, לעצב ממשקי ביקורת אנושית, ולהפחית סיכון משפטי ותדמיתי הנובע מחוסר אמינות של המודל. כך ניתן לעבור ממדידת "כמה המודל חכם" למדידת "כמה אפשר לסמוך עליו" בהקשרים עסקיים קריטיים.

Rahul Baxi
קרא עוד ←
מתפיסה חזותית לאמפתיה עמוקה: מסגרת הערכה אוטומטית לציורי בית־עץ־אדם (House‑Tree‑Person) באמצעות מודלים לשוניים גדולים רב־מודליים (Multimodal LLMs) ושיתוף פעולה רב־סוכני
arXiv (cs.AI)
בינה מלאכותית מסבירה

מתפיסה חזותית לאמפתיה עמוקה: מסגרת הערכה אוטומטית לציורי בית־עץ־אדם (House‑Tree‑Person) באמצעות מודלים לשוניים גדולים רב־מודליים (Multimodal LLMs) ושיתוף פעולה רב־סוכני

22 בדצמבר 2025

המחקר מציג דרך חדשה להשתמש בבינה מלאכותית כדי להעריך ציורים השלכתיים (House-Tree-Person) שנפוצים באבחון פסיכולוגי, במיוחד בקרב ילדים ומתבגרים. במקום להסתמך רק על פסיכולוג בודד שמנתח ידנית את הציור, המערכת האוטומטית סורקת את הציור, מזהה מאפיינים חזותיים (כמו צורת הבית, פרופורציות האדם, קיום פרטים חריגים), וקושרת אותם לידע קליני מובנה ולמאגר מקרי עבר. היא מפיקה דוח מילולי מובנה על מצבו הרגשי והחברתי של הנבדק, כולל נימוקים ברורים לכל מסקנה. עבור מערכות חינוך, בריאות ורווחה, המשמעות היא כלי סינון מהיר וזול לאיתור מצוקות רגשיות בקנה מידה גדול, עם עקביות גבוהה יותר ופחות הטיות אישיות. המערכת לא מחליפה את הפסיכולוג, אלא מספקת "חוות דעת שנייה" אוטומטית, תיעוד סטנדרטי ויכולת מעקב לאורך זמן, שיכולים לסייע בקבלת החלטות, תיעדוף תורים ובקרה איכותית על תהליכי אבחון.

Shuide Wen ואח'
קרא עוד ←
CogCanvas: ארטיפקטים קוגניטיביים עמידים לדחיסה עבור שיחות LLM (מודלי שפה גדולים) ארוכות
arXiv
עיבוד שפה טבעית

CogCanvas: ארטיפקטים קוגניטיביים עמידים לדחיסה עבור שיחות LLM (מודלי שפה גדולים) ארוכות

22 בדצמבר 2025

במונחים עסקיים, CogCanvas מציעה דרך פרקטית להפוך שיחות ארוכות עם צ’אטבוטים/עוזרים ארגוניים ל״זיכרון עבודה״ אמין שאינו נשבר כשחוסכים בטוקנים או מסכמים. במקום להסתמך על סיכומים כלליים שמאבדים ניואנסים, המערכת מחלצת מהשיחה פריטים שימושיים (החלטות שהתקבלו, עובדות מוסכמות, משימות ותזכורות) ושומרת אותם במבנה גרפי עם קשרים בזמן (מה הוחלט מתי, מה תלוי במה). כך ניתן להחזיר הקשר רלוונטי בשלב מאוחר יותר בצורה מדויקת יותר, במיוחד כשיש תלות כרונולוגית או סיבתית. המשמעות היא עוזרים שמנהלים פרויקטים, שירות לקוחות, מכירות או תהליכי HR יכולים לשמור עקביות לאורך ימים/שבועות של אינטראקציה, להפחית טעויות שנובעות מאיבוד הקשר, ולשפר אוטומציה של מעקב החלטות ומשימות—בלי צורך באימון מודל חדש ועם יכולת הטמעה מיידית כתשתית זיכרון/שליפה מעל LLM קיים.

Tao An
קרא עוד ←
Interpolative Decoding: חקר המנעד של תכונות האישיות במודלי שפה גדולים (LLMs)
arXiv (cs.AI)
אינטראקציית אדם-AI

Interpolative Decoding: חקר המנעד של תכונות האישיות במודלי שפה גדולים (LLMs)

22 בדצמבר 2025

המחקר מציג דרך פרקטית ויעילה "לכוון" אישיות של מודלי שפה גדולים מבלי לאמן אותם מחדש או לכתוב פרומפטים ארוכים ומסורבלים. במקום לנסות לתאר במילים איך הסוכן צריך להתנהג, בונים פעם אחת ייצוג מתמטי (וקטור) של תכונות אישיות שונות, למשל: אמפתיה, אסרטיביות, פורמליות, הומור ועוד. בזמן ריצת המערכת ניתן "להזיז סליידר" בין רמות שונות של כל תכונה, והמודל מיד מתחיל להגיב בסגנון תואם. עבור מנהלים ומוצר: המשמעות היא שניתן לעצב בקלות "פרסונות" שונות של צ'אטבוטים, יועצים דיגיטליים, דמויות במשחקים, סוכני שירות לקוחות או מנטורים לימודיים – ולשמור על עקביות ההתנהגות לאורך זמן. אפשר, למשל, להגדיר סוכן שירות אחד שהוא מאוד רגוע ומרגיע, ואחר שיותר ישיר וענייני, או להתאים את אישיות המערכת לפרופיל המשתמש (גיל, תרבות, העדפה). זה מאפשר בנייה מהירה של חוויות AI מותאמות, מבלי תהליך יקר של fine-tuning לכל פרסונה.

Eric Yeh ואח'
קרא עוד ←
PhysMaster: פיתוח פיזיקאי בינה מלאכותית (AI) אוטונומי למחקר בפיזיקה תיאורטית וחישובית
arXiv
מודלים גדולים

PhysMaster: פיתוח פיזיקאי בינה מלאכותית (AI) אוטונומי למחקר בפיזיקה תיאורטית וחישובית

21 בדצמבר 2025

המחקר מציע מסגרת מעשית לבניית "פיזיקאי־על" מבוסס בינה מלאכותית שיכול לבצע חלק ניכר מעבודת המחקר הפיזיקלי המקובלת: ניסוח רעיונות, כתיבת קוד סימולציה, הרצת ניסויים חישוביים, ניתוח תוצאות והשוואתם לתיאוריה ולספרות. עבור מנהלי מו"פ בתעשייה ובאקדמיה, המשמעות היא אפשרות להאיץ באופן דרמטי פרויקטים עתירי חישוב – למשל בחומרים, אנרגיה, מוליכים־על, התקני שבבים ואופטימיזציית מערכות. במקום צוות גדול של חוקרים שיעבור ידנית על מרחבי פרמטרים עצומים, PhysMaster מסוגל לחקור אוטונומית מאות ואלפי תרחישים, לסנן תוצאות בעייתיות, ולהצביע על כיוונים מבטיחים להמשך. בנוסף, המסגרת מספקת תהליך מתועד ורפרודוקטיבי המקל על בדיקה ושחזור של תגליות. בטווח הארוך, גישה זו יכולה לשמש כתבנית לבניית "מדעני־על" אוטונומיים גם בתחומים דוגמת כימיה, ביולוגיה חישובית או הנדסת מערכות מורכבות, וכך לשנות את מודל העבודה של מחקר ופיתוח מדעי.

Tingjia Miao (School of Artificial Intelligence ואח'
קרא עוד ←
Agentic AI (בינה סוכנת) לקבלת החלטות אוטונומיות, ברות־הסבר ובזמן אמת בתחום סיכון האשראי
arXiv (cs.AI); journal reference: INTELLIGENT SYSTEMS AND APPLICATIONS IN ENGINEERING, vol 12 No23, 2024
קבלת החלטות עם AI

Agentic AI (בינה סוכנת) לקבלת החלטות אוטונומיות, ברות־הסבר ובזמן אמת בתחום סיכון האשראי

21 בדצמבר 2025

לגופים פיננסיים (בנקים, חברות אשראי, פינטק) המחקר מציע “ארכיטקטורת מוצר” מעשית לבניית מנוע החלטות אשראי שמסוגל לעבוד בזמן אמת ולהסביר את עצמו: לא רק להוציא ציון, אלא להפעיל תהליך החלטה מודולרי שמאגד מידע ממקורות שונים, בודק חריגות, מעדכן החלטה כשהנתונים משתנים, ומפיק נימוקים שניתנים להצגה ללקוח, למבקר פנים ולרגולטור. בפועל זה יכול לקצר זמני אישור הלוואה, לאפשר התאמה דינמית למדיניות סיכון (למשל בעת תנודתיות מאקרו), ולהפחית עומס אנליסטים באמצעות אוטומציה מבוקרת. בנוסף, שכבות ה-XAI והמעקב אחר “נתיב החלטה” יכולות לתמוך בדרישות ציות, בבקרת איכות ובחקירת תקלות/הטיות, תוך שמירה על יכולת שיפור מתמיד באמצעות משוב מהשטח.

Chandra Sekhar Kubam
קרא עוד ←
חשיבה מחדש על בינה רב‑סוכנית מבעד לעדשת רשתות עולם‑קטן (Small‑World)
arXiv (cs.AI)
מערכות מרובות-סוכנים ובינה קולקטיבית

חשיבה מחדש על בינה רב‑סוכנית מבעד לעדשת רשתות עולם‑קטן (Small‑World)

18 בדצמבר 2025

המחקר מדגים כיצד אפשר לתכנן מערכות מרובות‑סוכנים (למשל כמה מודלי שפה גדולים שעובדים יחד) בצורה יעילה וחסכונית יותר, פשוט על ידי שינוי מבנה התקשורת ביניהם. במקום שכל סוכן ידבר עם כולם (עלות גבוהה, רעש וקושי להגיע להסכמה) או עם שכנים אקראיים, החוקרים מציעים להשתמש במבנה "עולם‑קטן": כל סוכן מחובר חזק לקבוצת שכן קטנה ויציבה, ובנוסף יש מעט קישורי‑על (קיצורי‑דרך) בין קבוצות. בארגון זה יכול להתבטא בשכבת "ועדות" או צוותים עם חיבורי גשר מצומצמים, כאשר כל סוכן הוא מודל או שירות. התוצאה: פחות קריאות‑API, פחות טוקנים, והחלטות טובות יותר תחת אותה מגבלת עלות. עבור מנהלים זה אומר שניתן לשפר מערכות קבלת החלטות מבוססות‑LLM, מערכות המלצה, בוטים משתפים‑פעולה ורובוטיקה צוותית – באמצעות תכנון נכון של גרף התקשורת, לפני שמגדילים כוח חישוב או גודל מודל.

Boxuan Wang ואח'
קרא עוד ←
פרסונליזציה מובנית: מידול אילוצים כמטרואידים (Matroids) עבור סוכני LLM ממזערי‑נתונים
arXiv
מודלים גדולים

פרסונליזציה מובנית: מידול אילוצים כמטרואידים (Matroids) עבור סוכני LLM ממזערי‑נתונים

9 בדצמבר 2025

המחקר עוסק בשאלה פרקטית מאוד: איך לתת למערכות כמו ChatGPT או סוכני AI ארגוניים להיות מותאמים אישית למשתמש, בלי לאסוף ולהחזיק כמות מופרזת של נתונים עליו. במקום "לאסוף הכול ואז לסנן", המחברים מציעים לשלב כבר בשלב התכנון מנגנון מתמטי שמגביל אילו סוגי נתונים מותר להמערכת לבקש, לשמור ולשלב. מנהלים, ארגונים ורגולטורים יכולים להשתמש במסגרת זו כדי להגדיר חוקים ברורים (לדוגמה: מותר להשתמש בהעדפות תוכן אך לא בנתוני מיקום; מותר לשלב לכל היותר שני סוגי נתונים רגישים; חובה לכבד העדפות מחיקה/אי־שימוש). לאחר מכן ניתן לאכוף חוקים אלה אוטומטית על כל סוכן LLM אישי, כך שגם מפתחים וגם ציות (compliance) מקבלים מודל מתמטי אחד ברור להחלטה אילו נתונים באמת נחוצים לפרסונליזציה ואילו אסורים, ובכך לצמצם סיכוני פרטיות, אחריות משפטית והטיות.

Daniel Platnick ואח'
קרא עוד ←
AI TIPS 2.0: מסגרת מקיפה להטמעה תפעולית של ממשל AI |
arXiv (preprint)
קבלת החלטות עם AI

AI TIPS 2.0: מסגרת מקיפה להטמעה תפעולית של ממשל AI |

8 בדצמבר 2025

המחקר מתייחס לשאלה מעשית מאוד עבור הנהלות, דירקטוריונים וצוותי חדשנות: איך להכניס AI לארגון בצורה בטוחה, אחראית ותואמת רגולציה – מבלי לעצור את החדשנות. AI TIPS 2.0 מספקת "ספר הפעלה" תפעולי: אילו מדיניות ותהליכים נדרשים, אילו מסמכי ביקורת ותיעוד צריך לייצר, מי אחראי על מה (מנכ"ל, דירקטוריון, CISO, Data Science, משפטי ועוד), ואילו בדיקות ובקרות לסיכונים יש לבצע בכל שלב של מחזור החיים של המערכת. באופן פרקטי, אפשר להשתמש במסגרת כדי: • להיערך לרגולציות כמו ה‑EU AI Act, רגולטורים פיננסיים ובריאותיים. • להוריד סיכון משפטי ותדמיתי (הטיות, פגיעה בפרטיות, החלטות לא שקופות וכו'). • לייצר סטנדרט אחיד בכל פרויקטי ה‑AI בארגון, במקום פתרונות נקודתיים. • להגדיר KPIs לניהול איכות, הוגנות ובטיחות של מודלים. המסמך מתאים כבסיס למדיניות AI ארגונית ולבניית תהליך Governance ישים ולא רק הצהרתי.

Pamela Gupta
קרא עוד ←
SDialog: ערכת כלים ב-Python לבניית סוכנים (Agents) מקצה לקצה, לסימולציית משתמש, ליצירת דיאלוגים ולהערכה
arXiv
מודלים גדולים

SDialog: ערכת כלים ב-Python לבניית סוכנים (Agents) מקצה לקצה, לסימולציית משתמש, ליצירת דיאלוגים ולהערכה

8 בדצמבר 2025

SDialoG מציע מסגרת מעשית לארגונים ולצוותי פיתוח שרוצים לבנות, לבדוק ולשפר מערכות שיחה מבוססות מודלים לשוניים – כמו צ'אטבוטים לשירות לקוחות, עוזרים פנימיים, או סוכני ידע. במקום לפתח מאפס תשתית לכל סוכן, סימולציה והערכה, הכלי מאפשר להגדיר תרחישים, "אישיות" וידע של הסוכן באמצעות קבצי תצורה פשוטים, להריץ דיאלוגים אוטומטיים מול משתמשים מדומים, ולמדוד ביצועים (דיוק, שלמות, עקביות, שביעות רצון משוערת ועוד) באמצעים אוטומטיים. כך ניתן להשוות מודלים שונים, ניסוחי פרומפט, ומדיניות זיכרון/כלים לפני פריסה אמיתית, לצמצם סיכונים ולחסוך משאבי אנוטציה ידנית. עבור מנהלים, המשמעות היא יכולת לפתח ולהעריך במהירות "פרוטוטייפים" של סוכנים שיחתיים, לבחון תרחישים קצה, ולהגדיר סטנדרטים אחידים למדידה ולהשוואה בין פתרונות שונים בתוך הארגון או מול ספקים.

Sergio Burdisso ואח'
קרא עוד ←
שיפור ההסבריות של רשתות נוירונים גרפיות (GNNs) באמצעות ניתוחים מושגיים (קונספטואליים) ומבניים והרחבותיהם
arXiv
בינה מלאכותית מסבירה

שיפור ההסבריות של רשתות נוירונים גרפיות (GNNs) באמצעות ניתוחים מושגיים (קונספטואליים) ומבניים והרחבותיהם

8 בדצמבר 2025

המחקר רלוונטי לכל ארגון שעושה שימוש במודלים של למידת מכונה על נתוני גרפים – למשל ברשתות חברתיות, פיננסים, בריאות, תחבורה או מערכות המלצה – ורוצה להבין ולבקר את החלטות המערכת. הוא מסביר כיצד ניתן לפרש מודלי GNN לא רק דרך "אילו קשתות או צמתים הובילו לתוצאה", אלא גם דרך קונספטים גבוהים יותר (למשל: קהילה הדוקה ברשת חברתית, מודול פונקציונלי בגרף ביולוגי או דפוס עסקאות חשוד בבנק). הבנה כזו מאפשרת: 1. שיפור אמון משתמשים ורגולטורים, באמצעות הסברים עקביים וברורים. 2. איתור הטיות, באגים או שימוש שגוי בנתונים – לפני פריסה נרחבת. 3. עיצוב מוצרים ויכולות אנליטיות שמייצרות תובנות עסקיות ניתנות לפעולה, במקום "קופסאות שחורות". 4. כיווני פיתוח לכלים ומסגרות XAI מותאמות־דומיין ליישומים על גרפים (פיננסים, בריאות, טלקום ועוד).

Tien Cuong Bui
קרא עוד ←
לקראת מדע הסקיילינג של מערכות סוכנים
arXiv (cs.AI)
מערכות מרובות-סוכנים ובינה קולקטיבית

לקראת מדע הסקיילינג של מערכות סוכנים

8 בדצמבר 2025

המחקר מספק שפה כמותית וכלי מדידה לארגונים שרוצים לבנות מערכות מורכבות של "סוכני AI" – למשל צוותים של בוטים שעובדים יחד על מחקר, כתיבה, פיתוח תוכנה, תמיכה בלקוחות או אנליטיקת נתונים. במקום פשוט "להוסיף עוד מודלים" בתקווה לשיפור, המאמר מראה איך למדוד האם סוכנים נוספים באמת משפרים ביצועים או רק מעלים עלות ומורכבות. הוא מפרק את התפקוד של מערכת סוכנים לשלושה מרכיבים: יעילות (כמה מהר וזול המערכת עובדת), כיסוי (כמה מגוון הפתרונות/הכישורים שהיא מביאה) ותחקור שגיאות (האם סוכן אחד מתקן שגיאות של אחר או להפך – מגביר אותן). על בסיס ניתוח של מאות קונפיגורציות, המחקר מספק כללים אמפיריים: איזה מבנה תקשורת (סינגל, מרכזי, מבוזר, היברידי) מתאים לסוגי משימות שונים, מתי כדאי לעצור בהוספת סוכנים, ואיך לתכנן מנגנוני תיאום וכלים כדי למנוע התפוצצות עלויות ושגיאות. זה קריטי לחברות שמנסות להקים מערכות AI מרובות-מודלים בקנה מידה גדול לשימושים עסקיים ורוצים להימנע מ"אובר-אינג'נירינג" יקר ולא יעיל.

Yubin Kim ואח'
קרא עוד ←
אמון מכויל בהתמודדות עם הזיות של LLMs (מודלים גדולים לשפה): מחקר איכותני
arXiv (The 3rd International Conference on Foundation and Large Language Models, FLLM 2025)
אינטראקציית אדם-AI

אמון מכויל בהתמודדות עם הזיות של LLMs (מודלים גדולים לשפה): מחקר איכותני

8 בדצמבר 2025

המחקר מספק הבנה מעמיקה איך אנשים רגילים – עובדים, סטודנטים, משתמשים פרטיים – באמת משתמשים במודלי שפה גדולים, ואיך הם מחליטים מתי לסמוך עליהם ומתי לא. זה חשוב מאוד למנהלים, מקבלי החלטות ומעצבי מוצרים שמכניסים ChatGPT ודומיו לכלים ארגוניים, שירות לקוחות, תמיכה טכנית, כתיבה, קוד ועוד. במקום להניח שהמשתמש "או סומך או לא סומך", המחקר מראה שהאמון הוא דינמי ותלוי הקשר: המשתמשים משקיעים יותר בדיקות בתחומים רגישים, בוחרים אסטרטגיות שונות (חיפוש בגוגל, השוואה למקורות אחרים, שימוש בידע אישי), ונוטים לפתח דפוסי עבודה קבועים עם המודלים. התובנות יכולות לסייע בעיצוב מנגנוני הבהרה, אזהרות, הצגת מקורות ואפשרויות בדיקה, כך שהעובדים יקבלו ערך פרודוקטיבי גבוה מה‑LLM, אך יצמצמו סיכון לטעויות חמורות. לארגונים, זה תשתית לחשיבה על מדיניות שימוש, הכשרות עובדים וניהול סיכונים סביב AI.

Adrian Ryser ואח'
קרא עוד ←
Adjudicator: תיקון תוויות רועשות באמצעות מועצת סוכני LLM המונחית על ידי גרף ידע (KG)
arXiv (cs.AI)
למידה חישובית

Adjudicator: תיקון תוויות רועשות באמצעות מועצת סוכני LLM המונחית על ידי גרף ידע (KG)

4 בדצמבר 2025

המחקר מציע תשתית מעשית לשיפור איכות נתוני האימון במערכות בינה מלאכותית, במיוחד במקומות שבהם לטעויות יש מחיר כלכלי או בטיחותי גבוה. במקום לסמוך על מתייגים אנושיים או על מודל יחיד, Adjudicator מפעיל מספר מודלי שפה גדולים (LLM) כסוכנים שונים, שמייעצים אחד לשני ומבוססים על גרף ידע מובנה מהדומיין. כך ניתן לבדוק מחדש תוויות שנוצרו אוטומטית או ידנית, לחשוף חוסר עקביות, ולתקן אותן בליווי הסבר. עבור ארגונים – למשל בבקרה תעשייתית, פיננסים, רפואה או שירות לקוחות – המשמעות היא שאפשר להוריד את כמות השגיאות בנתונים המסומנים בלי להשקיע עוד מאות שעות עבודה אנושית, לשמור על עקביות לאורך זמן ולהגדיל את אמינות המודלים והעמידה ברגולציה. בנוסף, מכיוון שהמערכת מחזירה נימוקים, ניתן לשלב אותה בתהליכי ביקורת איכות, טיוב נתונים והוכחת תאימות (compliance) באופן שקוף יחסית.

Doohee You ו-Sundeep Paul
קרא עוד ←
רתימת מודלי שפה גדולים (LLMs) למיצוי נתונים מובנים מרשומות רפואיות בלתי מובנות
arXiv (preprint, arXiv:2512.13700)
בינה מלאכותית רפואית ובריאות דיגיטלית

רתימת מודלי שפה גדולים (LLMs) למיצוי נתונים מובנים מרשומות רפואיות בלתי מובנות

2 בדצמבר 2025

העבודה מציעה דרך מעשית להשתמש במודלי שפה גדולים כדי להפוך טקסטים קליניים חופשיים של רשומות חולים לנתונים מובְנים, באופן שמפחית משמעותית עבודה ידנית של רופאים וצוותי נתונים. במקום שאנשי צוות יעברו על דוחות שחרור, מכתבי ייעוץ וסיכומי אשפוז ויקודדו ידנית עשרות שדות לרישום מחקרי או דיווח איכות, המערכת מפעילה LLM בתוך סביבה מאובטחת של בית החולים, שואלת אותו שאילתות מדויקות (למשל: חומרת פציעת חוט השדרה לפי AIS, רמת הפגיעה, תאריכים ומדדים נוספים), ומחזירה תשובות במבנה טבלאי. לאחר מכן האדם רק מאמת/מתקן במקום להתחיל מאפס. זה מקצר את זמן ההפקה של דאטה למחקר ולדיווח רגולטורי, מעלה עקביות, ומאפשר לבתי חולים להפיק ערך מה‑EHR הקיים בלי פרויקטי פיתוח יקרים. עבור הנהלות, המשמעות היא יכולת בניית רישומים קליניים גדולים, ניטור תוצאות ותמיכה במחקר קליני באופן זול ומהיר יותר.

Mitchell A. Klusty ואח'
קרא עוד ←
ארכיטקטורת קלאוזות מבוססת מונאדות עבור מדד הגיל המלאכותי (Artificial Age Score, AAS) במודלי שפה גדולים
arXiv (Computer Science > Artificial Intelligence)
בינה מלאכותית מסבירה

ארכיטקטורת קלאוזות מבוססת מונאדות עבור מדד הגיל המלאכותי (Artificial Age Score, AAS) במודלי שפה גדולים

2 בדצמבר 2025

המחקר מציע דרך שיטתית להעריך את "גילו" או רמת הבשלות של מודל בינה מלאכותית, בדגש על מודלי שפה גדולים. במקום להסתמך רק על ביצועי מבחן (דיוק, BLEU וכו'), המדד AAS בודק היבטים עמוקים יותר: עד כמה המודל מחזיק בזיכרון פנימי עקבי, האם הוא פועל באופן אוטונומי ועקבי לאורך זמן, ועד כמה המבנה הלוגי שלו מאורגן והרמוני. עבור מנהלים, מפתחי מערכות ומדעני נתונים, זה מספק כלי קונספטואלי ופרקטי להשוואת מודלים, לבדיקה האם מודל "צעיר מדי" (בלתי יציב, תגובתי בלבד) או "בשל" יותר (שומר הקשרים, מגיב בצורה הגיונית ועקבית). ניתן להשתמש במסגרת כדי להגדיר קריטריונים לרגולציה פנימית, אבטחת איכות ועמידה בסטנדרטים אתיים: למשל, לדרוש סף AAS מינימלי למודלים שיוצאים לפרודקשן בתחומים רגישים (פיננסים, רפואה, חינוך). המסגרת גם מספקת שפה משותפת לדיאלוג בין מהנדסים, אנשי מוצר ורגולטורים סביב השאלה "עד כמה המודל הזה בוגר ואחראי".

Seyma Yaman Kayadibi
קרא עוד ←
בנצ'מרקינג של סוכני LLM עבור זרימות עבודה לניהול עושר
arXiv (Computer Science > Artificial Intelligence)
קבלת החלטות עם AI

בנצ'מרקינג של סוכני LLM עבור זרימות עבודה לניהול עושר

30 בנובמבר 2025

המחקר מציע סט מבחנים וכלי הדמיה שמאפשרים לבדוק בצורה מבוקרת האם וכיצד ניתן לסמוך על סוכני בינה מלאכותית (מבוססי מודלים גדולים) לביצוע משימות של יועצי השקעות וניהול עושר. עבור בנקים, בתי השקעות, פינטק ומנהלי עושר – זהו כלי פרקטי לבחון מודלים לפני שמסמיכים אותם לעבוד ישירות מול לקוחות: האם הם יודעים לאסוף נתונים רלוונטיים, להשוות מוצרים, לבנות תיקים, לבצע סימולציות, ולהסביר ללקוח את ההמלצה – בלי לעשות שגיאות מסוכנות או להפר הוראות רגולטוריות. אפשר להשתמש במסגרת כבסיס ל-PoC ולבחירת ספק מודלי LLM, להשוות בין מודלים שונים תחת אותן משימות, ולמדוד שיפור לאורך זמן. בנוסף, המאמר מראה כיצד לשלב מעריך אוטומטי (LLM evaluator) שמדרג את איכות הביצוע, כך שארגונים יכולים להריץ אלפי סימולציות ולמדוד ביצועים לפני הטמעה אמיתית.

Rory Milsom
קרא עוד ←
STRIDE: מסגרת שיטתית לבחירת ארכיטקטורות AI (Agentic AI, עוזרי AI או קריאות ל‑LLM)
arXiv
מודלים גדולים

STRIDE: מסגרת שיטתית לבחירת ארכיטקטורות AI (Agentic AI, עוזרי AI או קריאות ל‑LLM)

30 בנובמבר 2025

העבודה נותנת למנהלי מוצר, מנהלי פיתוח וארכיטקטים דרך מעשית לבחור איזה סוג פתרון AI כדאי להטמיע למשימה נתונה – צ'אט-בוט פשוט עם קריאות LLM, עוזר AI מובנה במערכת, או סוכן אוטונומי מורכב. במקום "לירות לכל הכיוונים" עם סוכנים חכמים יקרים ומסוכנים תפעולית, STRIDE עוזרת לפרק את המקרה העסקי למשימות, להעריך עבור כל משימה את הצורך באוטונומיה, זיכרון, רב-שלביות ושליטה, ולקבל החלטה מבוססת נתונים על הארכיטקטורה. התוצאה: פחות פרויקטי AI מנופחים וכושלים, יותר פתרונות מדויקים לצורך (just-enough AI), שליטה טובה יותר בסיכון תפעולי ומשפטי, וחיסכון ניכר בעלויות חישוב ותפעול. המסגרת מתאימה לארגונים שמפתחים כלים ל-SRE, ניהול תקלות, ציות, תפעול IT או כל מערכת שבה שוקלים "להכניס סוכן" – ומסייעת לקבוע האם ואיפה זה באמת נחוץ.

Shubhi Asthana ואח'
קרא עוד ←
היסק בפעולה: שליפת ידע מונעת על-ידי MCTS (Monte Carlo Tree Search) עבור מודלים גדולים של שפה (LLMs) |
Journal of Artificial Intelligence Research (JAIR) / arXiv preprint arXiv:2601.00003
מודלים גדולים

היסק בפעולה: שליפת ידע מונעת על-ידי MCTS (Monte Carlo Tree Search) עבור מודלים גדולים של שפה (LLMs) |

27 בנובמבר 2025

המאמר מציע מסגרת מעשית לשיפור מודלי שפה גדולים כאשר הם נדרשים לענות על שאלות מורכבות הנשענות על ידע חיצוני רב ומפוזר (מאגרי ידע, מסמכים ארגוניים, מאמרים וכו'). במקום לאחזר אוסף קבוע של מסמכים לפי דמיון טקסטואלי, המערכת "מתכננת" את תהליך החיפוש צעד-אחר-צעד: המודל מחליט אילו מילות מפתח או נושאים לחפש בשלב הבא, ורכיב MCTS בוחר את מסלולי החיפוש המבטיחים ביותר על בסיס תרומתם לנימוק הסופי. עבור מנהלים וארגונים, המשמעות היא שמערכות שאלות-תשובות, עוזרי ידע פנימיים וצ'טבוטים ארגוניים יכולים להסתמך בצורה יעילה ושיטתית יותר על מאגרי המידע, להציג תשובות מבוססות מקורות מגוונים, ולהפחית טעויות הנגרמות מכך שהמודל "ממציא" ידע. השיטה רלוונטית במיוחד לתחומים עתירי מסמכים כמו משפט, רפואה, פיננסים ותמיכה טכנית.

Shuqi Liu ואח'
קרא עוד ←
כוונון עדין של מודלי שפה גדולים לסקר אוטומטי לדיכאון בפידג'ין ניגרי (Nigerian Pidgin English): מחקר פיילוט של GENSCORE
arXiv (preprint)
למידה חישובית

כוונון עדין של מודלי שפה גדולים לסקר אוטומטי לדיכאון בפידג'ין ניגרי (Nigerian Pidgin English): מחקר פיילוט של GENSCORE

27 בנובמבר 2025

המחקר מציע מסלול מעשי לפיתוח כלי סקר דיכאון דיגיטליים, מותאמי תרבות ושפה, עבור אוכלוסיות שמודרות לעיתים ממערכות בריאות פורמליות. באמצעות כוונון מודלים גדולים לשפה על אוסף קטן יחסית של ראיונות אודיו בפידג'ין ניגרי, החוקרים מראים שניתן להעריך תסמיני דיכאון ברמת דיוק שמתקרבת להערכה קלינית סטנדרטית (PHQ‑9), כולל דירוג חומרה. עבור מנהלי מערכות בריאות, ארגוני NGO, סטארטאפים בבריאות דיגיטלית ומקבלי החלטות במדיניות – המשמעות היא שניתן לפתח צ'טבוטים או מערכות מוקד טלפוני שמסוגלות לשוחח בשפה המקומית, לזהות סימני דיכאון מוקדמים ולהפנות להמשך טיפול, בעלות נמוכה ובהיקף גדול. המודל יכול לפעול גם במצבי חוסר במשאבי כוח אדם מקצועיים, לאפשר ניטור שוטף, ולהשתלב באפליקציות מובייל או קווי סיוע. הגישה ניתנת להכללה לשפות נוספות, מה שמאפשר להרחיב משמעותית את הנגישות לבריאות נפש גלובלית.

Isaac Iyinoluwa Olufadewa ואח'
קרא עוד ←
היסטוריה קצרה של טכנולוגיית Digital Twin (תאום דיגיטלי) |
PET Clinics (Clinics in Podiatric Medicine and Surgery) / Elsevier
בינה מלאכותית רפואית ובריאות דיגיטלית

היסטוריה קצרה של טכנולוגיית Digital Twin (תאום דיגיטלי) |

23 בנובמבר 2025

המחקר מסביר מהו Digital Twin ואיך אפשר להשתמש בו כדי לשפר קבלת החלטות, תכנון טיפולים והפחתת סיכונים במערכות מורכבות – ובעיקר ברפואה. במקום להסתמך רק על בדיקות תקופתיות או על ניסיון קליני מצטבר, Digital Twin מאפשר לבנות 'עולם וירטואלי' מחובר בזמן‑כמעט‑אמת לגוף המטופל: איסוף נתונים מחיישנים, הדמיות ותיק רפואי; עדכון מודלים חישוביים; והרצת "מה‑אם" על טיפולים שונים לפני שניתנים בפועל. עבור מנהלים בבתי חולים, חברות פארמה או חברות מכשור רפואי – המשמעות היא יכולת לתכנן ניסויים ופרוטוקולים בצורה זולה ובטוחה יותר, לצמצם אשפוזים חוזרים, לאתר סיבוכים לפני שהם קורים ולהציע שירותים מותאמים אישית. מעבר לרפואה, אותה תפיסה רלוונטית גם לתעשייה, לוגיסטיקה ותשתיות – כל מקום שבו כדאי לנהל מערכת מורכבת על בסיס חיזוי וסימולציה רציפה ולא רק על בסיס נתונים היסטוריים.

Yunqi Zhang ואח'
קרא עוד ←
DMA (Dynamic Memory Alignment): יישור (Alignment) מקוון של RAG באמצעות משוב אנושי
arXiv
עיבוד שפה טבעית

DMA (Dynamic Memory Alignment): יישור (Alignment) מקוון של RAG באמצעות משוב אנושי

9 בנובמבר 2025

המחקר שימושי לארגונים המבקשים לשפר מערכות חיפוש‑ממושך ביצירת שפה (RAG) כך שהתוכן שהן מחזירות יתיישב טוב יותר עם העדפות משתמשים אמתיות. עבור מנהלים במוצרים מבוססי תוכן (סייעני שיחה, צ'אטבוטים תומכי לקוחות, מנועי חיפוש ארגוניים), המאמר מציע פרקטיקה לשלב נתוני קליקים והעדפות תגובות אנושיות בתוך צנרת אימון שמייצרת both: (1) דירוגים מדויקים יותר של מסמכי חיפוש; (2) מודלים שיוצרים תגובות שנראות ומוערכות כמתאימות יותר למשתמש. בנוסף, התהליך מדגיש את הצורך לאזן בין איכות התשובות לזמני תגובה ומספק דרך לדיסטילציה של מדדים כבדים לתרגול מהיר בפרודקשן — כלומר ניתן ליישם שיפורים בלי להקריב סיבולת ועלויות מחשוב גבוהות.

Yu Bai ואח'
קרא עוד ←
מאגר נתונים חדש על מבנה ארגוני: בחינת המבנה הארגוני באמצעות הרכב צוות ההנהלה הבכירה (TMT)
Strategic Management Journal (Wiley Online Library)
אחר.

מאגר נתונים חדש על מבנה ארגוני: בחינת המבנה הארגוני באמצעות הרכב צוות ההנהלה הבכירה (TMT)

8 בנובמבר 2025

למנהלים ומנהלי עסקים: מאגר הנתונים מספק תמונה מסודרת וניתנת להשוואה של הרכב הנהלות בכירות בחברות ציבוריות גדולות לאורך זמן. זה מאפשר לזהות מגמות ארגוניות (כמו ירידה בשכבות היררכיות, עליה בכמות תפקידי "CXO" ותזוזה מ-business unit לתפקידים פונקציונליים), להשוות מבנים בין תעשיות, לעקוב אחרי שינויים בעקבות מיזוגים או החלפות הנהלה, ולתמוך בקבלת החלטות אסטרטגיות לגבי בניית הנהלה, חלוקת סמכויות וגיוס בכירים. ארגונים יכולים להשתמש בממצאים כדי לכוונן תכניות משכורות, תבניות קידום ותכנון ארגוני.

Daniel Albert ואח'
קרא עוד ←
אופטימיזציה ארכיטקטונית ברשתות נוירונים עמוקות: ניסויים בשיטה בהשראה תיאורטית
npj Artificial Intelligence
למידה עמוקה

אופטימיזציה ארכיטקטונית ברשתות נוירונים עמוקות: ניסויים בשיטה בהשראה תיאורטית

6 בנובמבר 2025

המחקר מציע תהליך פשוט ובעלות חישובית נמוכה לשיפור עמידות הרשת (confidence/robustness) מבלי להגדיל את מספר הפרמטרים או את דרישות החומרה. מנהלי מוצר ומהנדסי AI יכולים להשתמש בעקרון זה כדי לכוונן חלוקת נוירונים across‑layers ברשתות המיועדות להרצה על חומרה מוגבלת (tinyML, מערכות לווייניות, מערכות מוטמעות), לקבל תוצאה אמינה יותר תחת רעשים/תקלות קרינתיות, ולשפר את היציבות של התחזיות בלי לשנות את תפוקת הדיוק. בנוסף, המדד התרמודינמי (רדיוס ספקטרלי) יכול לשמש ככלי הנחייה פרקטי בבחירת טופולוגיה בסביבות פיתוח וייצור.

Paolo Branchini
קרא עוד ←
מהפכת ה‑AI: כיצד בינה מולטימודאלית תעצב מחדש את האקוסיסטם האונקולוגי
npj Artificial Intelligence
בינה מלאכותית רפואית ובריאות דיגיטלית

מהפכת ה‑AI: כיצד בינה מולטימודאלית תעצב מחדש את האקוסיסטם האונקולוגי

6 בנובמבר 2025

המחקר מציג כיצד ארגונים בריאותיים, חברות פארמה וגורמי ניהול יכולים להטמיע מערכות MMAI כדי לשפר דיוק אבחון, לזהות אוכלוסיות בסיכון, לשפר התאמת טיפולים ולהפחית עלויות ניסויים ופיתוח תרופות. מבחינת מנהלים: MMAI מאפשר קבלת החלטות מושכלת יותר על בסיס אינטגרציה של מקורות נתונים שונים, ייעול גיוס חולים לניסויים, יצירת ספרות ממשית (RWE) לתמחור מבוסס ביצועים ולהפחתת טיפול מיותר (חיסכון בעלויות וטובה למטופל). יחד עם זאת נדרש להשקיע בתשתיות נתונים מאוחדות, מדיניות פרטיות, והערכות כלכליות ורגולטוריות לפני פריסה בכל רחבי המערכת.

David Dellamonica
קרא עוד ←
סוכני הסקה בזמן אמת בסביבות מתפתחות
arXiv
מערכות מרובות-סוכנים ובינה קולקטיבית

סוכני הסקה בזמן אמת בסביבות מתפתחות

6 בנובמבר 2025

המחקר מספק מסגרת ויישום מעשיים להבנת האופן שבו סוכנים אוטונומיים (רובוטים, סוכני תוכנה, מערכות שירות אוטונומיות) צריכים לתכנן ולהגיב בסביבות שמשתנות בזמן אמת. למנהלים ומנהלי מוצר זה אומר: 1) בבניית מוצרים אוטונומיים חשוב לבחור ארכיטקטורת סוכן שתתאים לרמת דינמיות ובמורכבות הסביבה; 2) פתרונות תגובתיים מתאימים כאשר זמן תגובה נמוך ודרישות המשימה פשוטות; 3) פתרונות מבוססי תכנון (ואינטגרציה שלהם עם יכולות תגובה) מספקים עמידות טובה יותר ושיעור הצלחה גבוה יותר במשימות עסקיות מורכבות; 4) הכלים שהמחברים מציעים (AgileThinker ו-Real-Time Reasoning Gym) יכולים לשמש לאימות ארכיטקטורות ולקבלת החלטות השקעה בפיתוח יכולות AI בזמן אמת.

Yule Wen ואח'
קרא עוד ←
ORCHID: סיווג מתוזמר המוגבר באמצעות אחזור עם קבלת החלטות אינטליגנטית Human-in-the-Loop (האדם-בלולאה) לנכסים בסיכון גבוה
arXiv (preprint)
קבלת החלטות עם AI

ORCHID: סיווג מתוזמר המוגבר באמצעות אחזור עם קבלת החלטות אינטליגנטית Human-in-the-Loop (האדם-בלולאה) לנכסים בסיכון גבוה

6 בנובמבר 2025

המחקר מציע כלי מבוסס בינה מלאכותית לשיפור תהליכי קבלת החלטות בארגונים שמנהלים נכסים מסוכנים/רגישיים (כגון אתרי אנרגיה, תשתיות, מתקנים מדעיים וכו'). עבור מנהלים ובעלי אחריות: ORCHID מספק זרימת עבודה שממזגת חיפוש אוטומטי של ראיות, סיכום והצגה מסודרת של ההיגדים שמובילים להמלצה סיווגית, ומכניס שלב ביקורת אנושי מובנה לפני קבלת החלטה סופית. המשמעות המעשית: קבלת החלטות מהירה יותר ובאיכות גבוהה יותר, תיעוד אודיטבילי (audit trail) לצורך רגולציה וביקורת, ויכולת להפעיל את המערכת on-premise כדי לשמור על פרטיות ואבטחת מידע עבור מסמכים רגישים.

Maria Mahbub ואח'
קרא עוד ←
חיזוי אופציית ויתור אפיסטמית
arXiv (preprint)
למידה חישובית

חיזוי אופציית ויתור אפיסטמית

5 בנובמבר 2025

המחקר שימושי לארגונים ומנהלים המעוניינים לפרוס מערכי חיזוי בטוחים ואמינים: במקום להסתמך על מדדי ביטחון כלליים, השיטה מאפשרת למערכת לזהות מתי הבעיה היא חוסר ידע (epistemic) ולהעביר את המקרה לבחינה אנושית או לאסטרטגיית פעולה זהירה. זה מקטין סיכונים בתעשיות רגישות (רפואה, פיננסים, רגולציה), משפר את ניהול הזרימה של החלטות מעורבות-אדם/מכונה, ויכול להקטין עלויות טעויות קריטיות על ידי הקטנת מספר התחזיות השגויות בפועל תוך שמירה על כיסוי (coverage) תקין.

Vojtech Franc ו-Jakub Paplham
קרא עוד ←
נדרשת אחריותיות ביחסי אדם–סוכני AI
npj Artificial Intelligence
אינטראקציית אדם-AI

נדרשת אחריותיות ביחסי אדם–סוכני AI

4 בנובמבר 2025

המחקר מספק קווים מנחים למנהלים ומעצבי מוצר בעבודה עם סוכני AI ארוכי־טווח. במקום לאפשר תמיכה בלתי מותנית למשתמש, מוצעת גישה שבה המערכת משנה את רמת המעורבות בהתאם להתנהגות המשתמש — לדוגמה, להנמיך טון תגובה אם המשתמש פוגע/מעליב, לסרב לסייע בבקשות מזיקות (כמו ייעוץ לפגיעה או זיוף), או לנסות לעודד חשיבה מחדש במקרים שבהם הכוונה אינה חד־משמעית. המשמעות העסקית: שיפור אמון המשתמשים, הפחתת סיכונים משפטיים ואתיים, מניעת התקשות נורמטיבית של התנהגויות מזיקות בקרב משתמשים, ושיפור תדמית המותג באמצעות מדיניות אחראית ברמת UX ומודלים.

Benjamin Lange
קרא עוד ←
שיפור תחזיות המסלול והעוצמה של ציקלונים טרופיים באמצעות מודל OWZP-Transformer
npj Artificial Intelligence
למידה עמוקה

שיפור תחזיות המסלול והעוצמה של ציקלונים טרופיים באמצעות מודל OWZP-Transformer

2 בנובמבר 2025

המחקר מציע כלי חיזוי קצר-טווח מדויק ויעיל לסופות טרופיות. עבור מקבלי החלטות, שירותי חירום ומערכות ניהול סיכונים בחופים, OWZP-Transformer יכול לשפר התרעה מוקדמת על התדרדרות/התגברות מהירה, לתמוך בקבלת החלטות לגבי פינוי, הגנה על תשתיות ותכנון תגובה. המודל חסכוני יותר מבחינת חישובית בהשוואה למודלים הדינמיים המסורתיים, וניתן לשלבו במערכי אזהרה ביטחון-ציבור ובמערכות תכנון מבוסס מזג אוויר.

Zihao Lin
קרא עוד ←
פרטיות דיפרנציאלית מאפשרת ניתוח הוגן ומדויק מבוסס AI של הפרעות דיבור, תוך הגנה על נתוני מטופלים
npj Artificial Intelligence
בינה מלאכותית רפואית ובריאות דיגיטלית

פרטיות דיפרנציאלית מאפשרת ניתוח הוגן ומדויק מבוסס AI של הפרעות דיבור, תוך הגנה על נתוני מטופלים

2 בנובמבר 2025

המחקר מראה שניתן להפעיל שיטות פרטיות פורמליות (Differential Privacy) על מודלים של למידת עומק לניתוח דיבור פתולוגי מבלי לאבד יתר חשיבות קלינית. עבור מנהלי מערכות בריאות, רגולטורים וחברות טכניות זה אומר שניתן לפתח שירותי אבחון מבוססי קול (זיהוי דיסארתריה, דיסגלוסיה, CLP, וזיהוי פארקינסון) המגינים על פרטיות המטופלים ומקטינים סיכון להדלפות. פתרון זה מאפשר שיתוף פעולה בין מוסדות ויצירת מערכות ענן/פדרטיביות המייצרות תועלת רפואית תוך עמידה בדרישות חקיקה ותקינה (למשל GDPR).

Soroosh Tayebi Arasteh
קרא עוד ←
שילוב AI בזמן אמת והדרכת מומחה פנים-אל-פנים בהכשרה בסימולציה של מיומנויות כירורגיות - מחקר אקראי מוצלב
npj Artificial Intelligence
בינה מלאכותית רפואית ובריאות דיגיטלית

שילוב AI בזמן אמת והדרכת מומחה פנים-אל-פנים בהכשרה בסימולציה של מיומנויות כירורגיות - מחקר אקראי מוצלב

2 בנובמבר 2025

המחקר מדגים שאינטגרציה של מערכות AI בזמן אמת בסימולטורים כתחליף חלקי או כמשלים להדרכה פרונטלית יכולה להוזיל זמן מעמיק של מדריכים, לשפר אבחון וציוני ביצוע מובנים, ולהוריד סיכוני תפעול (פגיעה ודימום) במהלך אימון. למנהלים חינוכיים בבתי חולים ומוסדות הכשרה: תוכניות הכשרה היברידיות שמשלבות מפגש מומחה בתחילת הדרך ולאחריו אימון מבוסס AI עשויות להאיץ העלאת מיומנות ולשמור על רמות ביצוע גבוהות עם פחות משאבי הדרכה מומחים; יש לתכנן ליישום הדרגתי ולבחון עומס קוגניטיבי, רגולציה ואינטגרציה טכנית לפני פריסה רחבה.

Recai Yilmaz
קרא עוד ←
למידת אופרטורים עמוקה למידול זרימת דם בכלי דם עם היצרות
npj Artificial Intelligence
בינה מלאכותית רפואית ובריאות דיגיטלית

למידת אופרטורים עמוקה למידול זרימת דם בכלי דם עם היצרות

2 בנובמבר 2025

המחקר מספק כלי חישובי מהיר ומדויק לאומדן פונקציונלי (FFR) של היצרויות בעורקי הלב ללא צורך בבדיקה חודרנית. עבור מנהלים ומקבלי החלטות בבתי חולים ובחברות טכנולוגיה רפואית — השיטה מאפשרת הפחתת עלויות וזמן חישוב מול סימולציות 3D יקרות, שיפור בתמיכה להחלטה קלינית (האם ליישם סטנט), ושילוב מקורות נתונים הטרוגניים (סימולציות, ניסויים, נתוני מטופל עתידיים) בעזרת ארכיטקטורה מודולרית שתתמוך בפריסה קלינית מהירה יותר. מבחינה עסקית — גישה זו מקצרת תהליכי פיתוח מוצר AI‑בקצה, מפחיתה תלות בנתוני in vivo רבים ומגבירה אמינות בעזרת אינטגרציה של ידע פיזיקלי.

Alexis Velikorodny
קרא עוד ←
הערכת יכולתו של GPT‑4 לנסח חומרי הסכמה מדעת לבדיקות גנטיות
npj Artificial Intelligence
עיבוד שפה טבעית

הערכת יכולתו של GPT‑4 לנסח חומרי הסכמה מדעת לבדיקות גנטיות

2 בנובמבר 2025

המחקר מראה עד כמה אפשר להשתמש במודלים שפתיים גדולים כדי לייצר טיוטות מקדימות למסמכי הסכמה מדעת בחיים הרפואיים. למנהלי מערכות בריאות ולמפתחים זה משמעותי: במקום להשקיע זמן רב בכתיבה ידנית של מסמכים סטנדרטיים, ניתן להפיק נוסחים ראשוניים מהר ולחסוך משאבי כוח אדם, אך יש להטמיע בקרת איכות קלינית לפני שימוש חולה. עבור מנהלים זה מצביע על פוטנציאל לייעול תהליכי תקשורת עם המטופל, קיצוץ בעומס על ייעוץ גנטי סטנדרטי, והצורך בנהלי בדיקה ורגולציה לשמירה על דיוק ושקיפות בשפות שונות.

Eirini Petrou
קרא עוד ←
השגת למידת מכונה ניתנת לפרשנות באמצעות פירוק פונקציונלי של מודלי קופסה שחורה לאפקטים ניתנים להסבר של המנבאים
npj Artificial Intelligence
בינה מלאכותית מסבירה

השגת למידת מכונה ניתנת לפרשנות באמצעות פירוק פונקציונלי של מודלי קופסה שחורה לאפקטים ניתנים להסבר של המנבאים

2 בנובמבר 2025

למנהל או מנהל מוצר: השיטה מאפשרת לקחת מודל חיזוי מדויק אך שקוף חלקית (כמו רנדום פורסט או גרדיאנט בוסטינג), ולייצר ממנו 'מודל תחליפי' שמפרק את תחזיותיו לאפקטים של תכונות בודדות ואינטראקציות זוגיות. המשמעות: קבלת החלטות מבוססת נתונים הופכת ברורה יותר — ניתן להראות לאחראים מדיניות, רגולטורים וגורמי מקצוע כיצד כל תכונה משפיעה על התחזית, באיזה סדר גודל ואיפה קיימות אינטראקציות חשובות. מתאים לשימושים רפואיים, סביבתיים, ביטוחיים ותעשייתיים שבהם שקיפות חשובה לקבלת אמון והובלת מדיניות.

David Köhler
קרא עוד ←
מעבר לרגרסיית סיכון בזמן בדיד: רגולריזציה בייסיאנית למידול עזיבה דינמי
Journal of Operations Management
למידה חישובית

מעבר לרגרסיית סיכון בזמן בדיד: רגולריזציה בייסיאנית למידול עזיבה דינמי

30 באוקטובר 2025

למנהלים ומשאבי אנוש: השיטה מאפשרת לחזות בצורה מדויקת יותר מתי עובדים עשויים לעזוב ולהבין אילו משתנים באמת משפיעים — גם כאשר ההשפעות אינן סימטריות או משתנות בזמן. שילוב רגולריזציה בייסיאנית מפחית רעשים ומזהה משתנים רלוונטיים להפחתת סיכון עזיבה. המשמעות העסקית: תכנון כוח אדם יעיל יותר, הקצאת תקציבים למניעת עזיבה (retention) לפי עלות-תועלת, ושיפור החלטות פרסקריפטיביות (מי לטפל, מתי וכיצד) כדי להפחית עלויות חליפות והפסדי ידע.

Ping Chou ואח'
קרא עוד ←
CATArena: הערכת סוכני LLM באמצעות תחרויות טורניר איטרטיביות
arXiv
מודלים גדולים

CATArena: הערכת סוכני LLM באמצעות תחרויות טורניר איטרטיביות

29 באוקטובר 2025

עבור אנשי ניהול ומקבלי החלטות: CATArena נותנת כלי מעשי להשוואה והערכה של סוכני AI/LLM בסביבות תחרותיות אמיתיות. במקום להסתמך על מדדי ביצוע מבודדים (accuracy/F1), הפלטפורמה בוחנת כיצד סוכנים משתפרים לאורך זמן, מתאמים אסטרטגיות מול יריבים ומנצלين משוב. זה מועיל בעת בחירת סוכן לפריסה עסקית (שירות לקוחות אוטומטי, מתווך שיחות, שותף לקבלת החלטות), כי היא מראה מי יציב, מי מתייעל באמצעות אינטראקציה ומי עלול להתנהג לא צפוי בתנאי תחרות. למנהלים בפיתוח מוצר: כלי כזה מסייע לסלק פתרונות שנראים טוב בניסויים סטטיים אך נכשלים בדינמיקה תפעולית, ומאפשר לכייל תהליכי fine-tuning ו-peer-training לפני הפצה.

Lingyue Fu ואח'
קרא עוד ←
השימוש ב‑LLMs לתייג נתונים במחקר בניהול: הנחיות יסוד ואזהרות
Strategic Management Journal
עיבוד שפה טבעית

השימוש ב‑LLMs לתייג נתונים במחקר בניהול: הנחיות יסוד ואזהרות

28 באוקטובר 2025

הממצא המעשי המרכזי הוא ש־LLMs יכולים להפחית עלויות וזמן אנוטציה של טקסטים במהירות ובמדרג גבוה לעומת קידוד ידני או איסוף נתוני אימון כבד. למנהלים ומחקרי נתונים זה אומר שאפשר לבצע ניתוחים סקייליים של טקסט (למשל סקרי צרכנים, ביקורות, תכנים פרסומיים) מהר וזול יותר, אך יש להקפיד על תיעוד החלטות טכניות (מודל, גרסה, פרומפטים) ובדיקות רגישות לפני קבלת החלטות עסקיות מבוססות על תוויות אלו — אחרת קיים סיכון למסקנות מוטעות כתוצאה משגיאות מסודרות במיון.

Natalie A. Carlson ו-Vanessa Burbano
קרא עוד ←
Game-TARS: מודלי יסוד מאומנים מראש (Foundation Models) עבור סוכני משחק מולטימודליים גנרליסטיים הניתנים להרחבה
arXiv
מודלים גדולים

Game-TARS: מודלי יסוד מאומנים מראש (Foundation Models) עבור סוכני משחק מולטימודליים גנרליסטיים הניתנים להרחבה

26 באוקטובר 2025

למנהלים ולמקבלי החלטות: המחקר מראה כי באמצעות אימון מוקדם (pretraining) על נתוני משחקים מולטימודאליים ניתן לפתח "מנועי אינטלקט" כללים שמיועדים לפעול במערכות משימות מורכבות — לדוגמה עוזרים אוטונומיים לבדיקת משחקים, בוטים חכמים לאוטומציה של בדיקות QA במשחקים, מערכות הדרכה חכמות בתוך משחקים, וסוכנים המשלבים ראייה וטקסט לאינטראקציה עם ממשקים וירטואליים. עבור חברות משחקים או סטארטאפים בתחום אינטראקציות ויזואליות, ניתן להשתמש בגישה זו כדי לקצר זמני פיתוח, לשפר בדיקות אוטומטיות, ולייצר סוכנים המסוגלים לבצע תרחישים של משתמשים מורכבים בלי תוויות ידניות רבות. מבחינת עלויות ותועלות — ההשקעה באיסוף נתונים והאימון מקדמת גנרליזציה חוצת-משחקים, מה שמקטין צורך בהתאמה ידנית לכל כותר.

Zihao Wang ואח'
קרא עוד ←
AI (בינה מלאכותית) והדה-מרכוז של היצירתיות הדיסציפלינרית
arXiv (preprint) — arXiv:2510.23734
השפעות חברתיות-כלכליות ומקרו של AI

AI (בינה מלאכותית) והדה-מרכוז של היצירתיות הדיסציפלינרית

26 באוקטובר 2025

למנהלים, עורכי מדעי ויושבי ראש מוסדות אקדמיים: המאמר מספק מסגרת חשיבתית להבנת הדרכים שבהן כלים חישוביים ובינה מלאכותית יכולים לשנות את אופי העבודה הדיסציפלינרית. שימושי לתכנון מדיניות תעסוקה, קביעת קריטריוני הערכה לפרסומים ומענקים, עיצוב תכניות לימוד (כדי לשלב כישורים שמשלימים כלים חישוביים) ולבחינת סיכוני החלפה/הדחקה של מיומנויות מקצועיות. עבור תעשייה וטכנולוגיה — המסמך מבהיר מתי להשקיע בכלים שמעצימים צוותים אנושיים ומתי מערכות אוטונומיות עלולות לצמצם דרישה לכישורים מקצועיים מסורתיים.

Eamon Duede
קרא עוד ←
Cultural Alien Sampler (CAS): יצירת אמנות פתוחת-קצה המאזנת בין מקוריות לקוהרנטיות
arXiv
בינה מלאכותית גנרטיבית

Cultural Alien Sampler (CAS): יצירת אמנות פתוחת-קצה המאזנת בין מקוריות לקוהרנטיות

26 באוקטובר 2025

מחקר זה מפתח כלי לבחירת רעיונות יצירתיים עבור מערכות ליצירת תמונות ואמנות. בעבור מנהלים ומקבלי החלטות בטכנולוגיה, שיווק ותוכן: CAS מאפשר למערכות אוטומטיות לייצר קונספטים מפתיעים אך בעלי פוטנציאל ישים — כלומר רעיונות חדשים שעדיין 'עובדים' חזותית. בתעשייה זה יכול לשפר תהליכי רעיונאות (ideation) למעצבים ויוצרים, לייעל גנרטורים של תוכן שיווקי/מיתוגי ולספק פיד מקוריות חזק יותר במוצרים יצירתיים (כלים ליצירת תמונות, ממשקי סיוע ליוצרים, פלטפורמות תוכן). CAS גם שימושי כמודול שמייצר הבדלים תרבותיים מבוקרים (לצורך בדיקות A/B ולימוד העדפות תרבותיות) ומאפשר לשלב מקוריות ללא איבוד אחידות סגנונית.

Alejandro H. Artiles ואח'
קרא עוד ←
לקראת הסברים ברמת‑כלי לעמדות שחמט באמצעות SHAP
arXiv
בינה מלאכותית מסבירה

לקראת הסברים ברמת‑כלי לעמדות שחמט באמצעות SHAP

25 באוקטובר 2025

המחקר מייעד כלי שיאפשר למנהלי מוצר, מפתחים וספקי שירותים בתחום אנליטיקת משחקים (או מערכות החלטה בתחום הדומה) להבין מדוע מודל חזותי/חישובי נותן הערכה מסוימת לפוזיציה. יתרונות מעשיים: 1) שקיפות גבוהה יותר בתוצרים של מנועי שחמט ומנועי רעיונות אסטרטגיים; 2) שיפור אמון משתמשים (מאמנים ושחקנים) בתוצאות המודל; 3) סיוע באיתור טעויות מודליות או הטיות נתונים על ידי זיהוי כלים/מבנים משפיעים; 4) אפשרות להתאמת מוצרי הדרכה אוטומטיים שמסבירים מה באמת משפיע על החלטה במקום רק להראות מהלך מומלץ.

Francesco Spinnato
קרא עוד ←
שיטת פתרון היברידית לתחרות Integrated Healthcare Timetabling (IHTTC) 2024
arXiv
בינה מלאכותית רפואית ובריאות דיגיטלית

שיטת פתרון היברידית לתחרות Integrated Healthcare Timetabling (IHTTC) 2024

22 באוקטובר 2025

היתרון המעשי של המחקר הוא מתודולוגיה מוכחת ליצירת לוחות זמנים מורכבים בבתי חולים ובמרכזי בריאות: פתרון משקי, איזון עומסים בין צוותים, שמירה על מגבלות רפואיות ומשאבים, והפחתת התנגשויות. למנהלים ומנהלי משאבי אנוש בתחום הבריאות זה מאפשר לקבל לוחות זמנים איכותיים בזמן ריצה סביר, לכוונן מדיניות (עדיפויות, גבולות שעות) ולשלב אוטומציה בחיסכון עלויות ותכנון המשכיות שירות.

Daniela Guericke ואח'
קרא עוד ←
מעבר להרחבת ההקשר: גיוון בתוצאות השליפה (Retrieval Diversity) משפר את הבנת הכוונה בשיחה רב-תורית
arXiv
עיבוד שפה טבעית

מעבר להרחבת ההקשר: גיוון בתוצאות השליפה (Retrieval Diversity) משפר את הבנת הכוונה בשיחה רב-תורית

21 באוקטובר 2025

המחקר רלוונטי למוצרי שיחה ועמדות שירות לקוחות: במקום להאכיל מערכות מודלים בכמות גדולה של טקסט היסטורי דומה, עדיף לאסוף תוצאות שליפה מגוונות (מניסוח, סגנון, תרחיש) ולשלבן במנגנון ההבנה. המשמעות למנהלים ומפתחים: שיפורי דיוק והפחתת ניסיונות כישלון עשויים להגיע משינוי במדיניות השליפה והבחירה של תיעוד ההקשר, ללא צורך בהגדלה דרמטית של רוחב המודל או איסוף כפול של נתונים. זה חוסך עלויות (אחסון/חישוב) ומשפר חוויית משתמש במערכות צ'אטבוט, עוזרי שיחה ומערכות שירות אוטומטיות.

Zhiming Lin
קרא עוד ←
מספרים עמומים: בחינה מחודשת — פעולות על מספרים עמומים לפי עקרון ההרחבה (extension principle)
arXiv
אחר.

מספרים עמומים: בחינה מחודשת — פעולות על מספרים עמומים לפי עקרון ההרחבה (extension principle)

21 באוקטובר 2025

המחקר רלוונטי למנהלים ומהנדסי מוצר העובדים עם מודלים של אי-ודאות ופוזיות (למשל בשירותים פיננסיים, תעשייה, מערכות בקרה או קבלת החלטות). הוא מספק הבנה ברורה מתי חישובים עם "מספרים פאוזים" יוצרים תוצאות תקינות וכיצד לבצע אותם בצורה פורמלית ויעילה יותר — כולל מימוש תוכנתי (C++) שמקל על אינטגרציה במערכות קיימות. המשמעות העסקית: קבלת החלטות מבוססות אי-ודאות תהיה אמינה יותר אם משתמשים בהגדרות ואלגוריתמים שמובאים במחקר, ומפתחים ימנעו תקלות לוגיות ותוצאות בלתי צפויות בפלט.

Krzysztof Siminski
קרא עוד ←
FABRIC: מסגרת ליצירת בינה ריאליסטית מבוססת-סוכנים (Agent-Based)
arXiv
מודלים גדולים

FABRIC: מסגרת ליצירת בינה ריאליסטית מבוססת-סוכנים (Agent-Based)

19 באוקטובר 2025

לבעלי תפקידים וניהול: FABRIC מציעה דרך מהירה להשיג מערכי נתונים ותצורות ניסוי לסוכנים אוטונומיים מבלי להשקיע באיסוף אנושי נרחב או בפיתוח ידני של תרחישים. למנהלים מוצר וטכנולוגיה זה אומר קיצור זמן פיתוח פרוטוטיפים, אפשרות לאוטומציה של יצירת תרחישים מבחן, ושיפור הבקרה על פורמט ואיכות הנתונים (באמצעות סכמה ו-validators). עבור ארגונים המעוניינים לשלב סוכנים חכמים בתהליכים תפעוליים—FABRIC מסייע בהטמעת צינורות מודולריים (ייצור נתונים, סינון, הרצה) שמקלים על ניסוי-וציון, התממשקות לכלים חיצוניים וקביעת מדיניות אבטחה/פרטיות לפני פריסה.

Abhigya Verma ואח'
קרא עוד ←
הטלת יריעת ההפעלות (Activation Manifold Projection): שחרור התנהגויות תלויות-משימה מארכיטקטורות LLM
arXiv
מודלים גדולים

הטלת יריעת ההפעלות (Activation Manifold Projection): שחרור התנהגויות תלויות-משימה מארכיטקטורות LLM

18 באוקטובר 2025

למנהל/איש עסקים: השיטה מאפשרת להעביר 'חבילות כישורים' (adapters) בין דגמי שפה שונים בלי צורך בגישה לנתוני האימון המקוריים או באימון מלא של המודל החדש. זה מקל שיווק ופריסה של יכולות מותאמות-לקוח, חוסך עלויות חישוביות ומשפר תאימות בין ספקי מודלים. ניתן להשתמש בCAST להאיץ פריסת תוספים פונקציונליים (כמו סגנון כתיבה, משימות דומיין-ספציפיות, או כלים עסקיים) על מודלים שונים בתוך ארגון או בין שותפים עסקיים.

Al Kari
קרא עוד ←
Branch-and-Browse: חקירת ווב יעילה ומבוקרת באמצעות הנמקה במבנה־עץ וזיכרון הפעולה
arXiv
מודלים גדולים

Branch-and-Browse: חקירת ווב יעילה ומבוקרת באמצעות הנמקה במבנה־עץ וזיכרון הפעולה

17 באוקטובר 2025

מחקר זה מפתח שיטה פרקטית לאוטומציה של סריקות ופעולות מורכבות באינטרנט באמצעות מודלים גדולים (LLMs). עבור מנהלים ומקבלי החלטות: הטמעה של Branch-and-Browse יכולה להפחית משאבים וזמן בתהליכי איסוף מידע, בדיקות ממשקי משתמש (UI testing), מילוי טפסים אוטומטי, מיזוג נתונים מאתרים מרובים ואוטומציה של משימות שירות לקוחות ברשת. השיטה מאפשרת שליטה טובה יותר בהתנהגות הסוכן — פחות פעולות מיותרות, חזרה יעילה על צעדים והקטנת עלות קריאות API — ויכולה לייעל תהליכים עסקיים שנעזרים בפעולות דפדוף וטרנסאקציות אינטרנטיות מורכבות.

Shiqi He ואח'
קרא עוד ←
OpenEstimate: הערכת מודלים לשוניים גדולים (LLMs) ביכולת הסקה תחת אי־ודאות באמצעות נתוני עולם אמיתי
arXiv
מודלים גדולים

OpenEstimate: הערכת מודלים לשוניים גדולים (LLMs) ביכולת הסקה תחת אי־ודאות באמצעות נתוני עולם אמיתי

15 באוקטובר 2025

פתרון זה משרת מנהלים ומקבלי החלטות בתחום טכנולוגיה ומוצר: OpenEstimate מספק מדד ומערכת בדיקה לבחינת כמה לחיזויים וכאשר מודל "בטוח מדי" או "לא מסביר" על הערכות מספריות. עבור חברות שמפתחות שירותים עם LLM (תחזיות שוק, סיווג סיכונים, תמיכה קלינית מופשטת), הכלים והמדדים מאפשרים לזהות אילו מודלים ניתנים לפריסה בבטחה, היכן צריך לבצע כיול (calibration), ואיך לפרש טווחי אמון שמודלים מדווחים. גם לארגונים משפטיים ורגולטוריים התוצאות רלוונטיות — להבטיח שמודלים מדווחים חוסר-וודאות במפורש ולא מעניקים אמון מופרז בתשובותיהם.

Alana Renda ואח'
קרא עוד ←
קביעת אמת־מידה (Benchmarking) למהימנות ההיסק במודלי בינה מלאכותית לניתוח מערכות אנרגיה
arXiv
בינה מלאכותית לאקלים, אנרגיה וסביבה

קביעת אמת־מידה (Benchmarking) למהימנות ההיסק במודלי בינה מלאכותית לניתוח מערכות אנרגיה

15 באוקטובר 2025

מחקר זה מספק כלי קונקרטי להערכה של יכולת ההיסק והאמינות של מודלי שפה/בינה מלאכותית כאשר הם מוחלים לניתוח תרחישי אנרגיה, תמחור טכנולוגיות והסקת מסקנות מדיניות. מנהלי אנרגיה, מקבלי החלטות ציבוריים, חברות ייעוץ טכנולוגי וספקי שירותי אנרגיה יכולים להשתמש בARB כדי: 1) לבחור מודלים המתאימים לתמיכה בהחלטות מקצועיות; 2) להעריך מהירות ודיוק תגובת מודלים בתרחישים רגולטוריים; 3) לאפיין נקודות תורפה (כגון חוסר משמעת בהתמודדות עם אי־ודאות או חוסר תאימות למדיניות) וליישם אמצעי בקרה (פוסטים־פרוססינג, כללי שמירה, אימון חוזר) לפני הטמעה בפועל; 4) להשוות ספקי AI באופן שקוף וליצירת דרישות קבלת החלטות מבוססות ראיות.

Eliseo Curcio
קרא עוד ←
Sketch2BIM: פייפליין רב‑סוכני לשיתוף פעולה אדם‑AI להמרת תוכניות רצפה שצוירו ביד למודלי BIM תלת‑ממדיים
arXiv
אינטראקציית אדם-AI

Sketch2BIM: פייפליין רב‑סוכני לשיתוף פעולה אדם‑AI להמרת תוכניות רצפה שצוירו ביד למודלי BIM תלת‑ממדיים

15 באוקטובר 2025

המחקר מציע כלי פרקטי להמרת שרטוטים ידניים של תכניות בניין למודלי BIM תלת־ממדיים מדויקים. בארגונים אדריכליים, קבלניים, ניהול נכסים ותיעוד מורשת ניתן לחסוך זמן וכסף על איסוף ופריסת נתוני מבנה: מהנדסים או שרטטים יוכלו להעלות סקיצות ידניות ולקבל מודל BIM חצי‑אוטומטי שמוכן לעריכה או לשילוב בשרטוטים מקצועיים. הפתרון מפחית את התלות בהקלדה ידנית של פרטים, מקל על שיתוף פעולה בין מומחים ללא צורך בידע מפורט ב‑BIM, ומשפר קווי עבודה בשרטוט מהיר, שימור מבנים, תכנון מחדש ושירותי שטח עבור חברות נדל"ן ותשתיות.

Abir Khan Ratul ואח'
קרא עוד ←
עיצוב פרוצדורלי של שלבי משחק באמצעות למידה חיזוקית עמוקה (Deep Reinforcement Learning)
arXiv
למידת חיזוק

עיצוב פרוצדורלי של שלבי משחק באמצעות למידה חיזוקית עמוקה (Deep Reinforcement Learning)

15 באוקטובר 2025

למנהלים ומפתחים בשדה המשחקים והבידור הדיגיטלי: השיטה מאפשרת אוטומציה חלקית של יצירת רמות משחק (level design) באמצעות שני סוכני למידת חיזוק, אחד שמייצר תכנים ואחד שמנסה לפתור אותם. המשמעות העסקית — חיסכון בזמן ומאמץ של מעצבי רמות, יכולת לייצר תוכן מותאם אישית או דינמי לשחקן, כלי לייצור ושיפור סביבות בדיקה לאוטומציה של QA, ואפשרות לפיתוח חוויות משחק מגוונות ומהירות יותר. ניתן לשלב אותה בצינורות פיתוח קיימים (Unity + ML‑Agents) לשם ניסוי פרוטוטיפים ולמידה על מאפייני קושי אוטומטיים לפני השקעה בעיצוב ידני.

Mirac{c} Buu{g}ra "Ozkan
קרא עוד ←
לקראת בינה ממוקדת-שגיאות (Error‑Centric Intelligence), חלק א׳: מעבר ללמידה תצפיתית (Observational Learning)
arXiv
בינה מלאכותית מסבירה

לקראת בינה ממוקדת-שגיאות (Error‑Centric Intelligence), חלק א׳: מעבר ללמידה תצפיתית (Observational Learning)

15 באוקטובר 2025

המחקר מציע תפיסה שימושית לבניית מערכות חכמות שמסוגלות לא רק לחזות על סמך נתונים היסטוריים אלא גם לפעול בבטחה וביעילות כשמופעלות (intervene) בעולם האמיתי. עבור מנהלים ומובילי מוצר: זה אומר להעדיף ארכיטקטורות היברידיות שמשלבות עקרונות תאורטיים (מודלים מבוססי סיבתיות / מנגנונים) עם רכיבי זיהוי ותיקון שגיאות, במקום להסתמך רק על הגדלת כמויות נתונים או על כוונון מודלים סטטיסטיים. התוצאה הרצויה: מערכות אמינות יותר בפרודקטיביות, סיכון מופחת בהטמעה ארגונית, והקטנת סיכונים תפעוליים בעת שימוש ב-AI במערכות קריטיות.

Marcus A. Thomas
קרא עוד ←
האם שקופיות מצגת מסייעות? הקשר רב־מודלי לתמלול אוטומטי של הרצאות בכנסים
arXiv
עיבוד שפה טבעית

האם שקופיות מצגת מסייעות? הקשר רב־מודלי לתמלול אוטומטי של הרצאות בכנסים

14 באוקטובר 2025

הממצאים שימושיים לארגונים ומנהלים המעוניינים לשפר דיוק תמלול בהרצאות, כנסים ושידורים אקדמיים/טכניים. בעזרת שילוב טקסט השקופיות כמקור הקשר ניתן לקבל תמלולים מדויקים יותר של מונחים מקצועיים ופחות טעויות הקשורות לשמות, מושגים וטכניות. זה יכול לחסוך זמן עריכה ידנית, לשפר חוויית חיפוש ותמצות תכני וידאו/אודיו, ולהעלות נגישות והנגשה של תכנים מקצועיים. חברות שמפתחות שירותי וידאו, פלטפורמות למידה מקוונת או כלים לארכוב ושאילתת תכנים יוכלו להטמיע את הגישה כדי להוריד עלויות ולשפר איכות תמלול.

Supriti Sinhamahapatra ו-Jan Niehues
קרא עוד ←
האם מודלי שפה גדולים (LLMs) מפגינים הטיות בלמידה סיבתית? תובנות משיפוט תלות (contingency judgment)
arXiv
מודלים גדולים

האם מודלי שפה גדולים (LLMs) מפגינים הטיות בלמידה סיבתית? תובנות משיפוט תלות (contingency judgment)

14 באוקטובר 2025

המחקר מדגים שיש סיכון ממשי בשימוש ב-LLMs כדי להסיק מסקנות סיבתיות — למשל בעניינים רפואיים, סיבתיים או תפעוליים. למנהלים במערכות בריאות, מוצר או סיכון טכנולוגי: יש להימנע מהסתמכות בלעדית על תשובות LLM לצורך החלטות מבוססות-סיבה; יש לשלב בדיקות אמפיריות חיצוניות, כלים סטטיסטיים ייעודיים להסקת סיבה, וליישם נהלים שמנטרים ומכוילים את דפוסי ההמלצות של המודל לפני הטמעה בפועל.

Mar'ia Victoria Carro ואח'
קרא עוד ←
מסגרת סיבתית להתאמת מדדי איכות תמונה לחוסן של רשתות נוירונים עמוקות
npj Artificial Intelligence
ראייה ממוחשבת

מסגרת סיבתית להתאמת מדדי איכות תמונה לחוסן של רשתות נוירונים עמוקות

13 באוקטובר 2025

המחקר שימושי למנהלי מוצר, מהנדסי נתונים ומקבלי החלטות המעוניינים לבחון במהירות ובאופן כמותי את "איכות" תמונות במאגרי נתונים גדולים בהקשר למודלי ראייה. במקום להסתמך רק על חוות דעת אנושית או בדיקות יקרות של מודלים שונים, ניתן להשתמש במדד משוכלל (ZSCLIP-IQA) כדי לאמוד מה צפוי להיות ביצוע המודל על אוסף תמונות נתון, לזהות האם מאגר נתונים מכיל אחוז גבוה של תמונות פגומות ולהשוות בין מאגרים לפני הכשרה/פריסה. זה עוזר בקבלת החלטות לגבי ניקוי נתונים, בחירת אסטרטגיות אימון, ושקלול סיכונים לפרודוקטיביות ודיוק שירותים מבוססי ראייה ממוחשבת.

Nathan Drenkow
קרא עוד ←
מעבר לקונסנסוס: צמצום הטיית הסכמתיות (Agreeableness Bias) בהערכות של מעריכי‑LLM
arXiv
מודלים גדולים

מעבר לקונסנסוס: צמצום הטיית הסכמתיות (Agreeableness Bias) בהערכות של מעריכי‑LLM

12 באוקטובר 2025

המחקר שימושי לארגונים המסתמכים על הערכות אוטומטיות באמצעות LLMs (למשל מערכות בדיקת קוד, הערכת עבודות, דירוג תשובות במערכות תמיכה). במקום להניח שהערכת ה-LLM היא 'אמת' או לשלב פשוט כמה מודלים יחד, השיטה מאפשרת לכייל את שיפוט ה-LLM באמצעות מדגם קטן של תוויות אנושיות ולתקן הטיה של "מאשרות". המשמעות הניהולית: ניתן לקבל מדדי איכות ואמינות קרובים לאנושיים בלי עלות אנושית מלאה — חיסכון בזמן ובמשאבים; שיפור בקבלת החלטות אוטומטית; והקטנת הסיכון להערכת יתר של תוצרים בעייתיים (כגון קוד עם שגיאות) במוצרים חינוכיים וארגוניים.

Suryaansh Jain ואח'
קרא עוד ←
חיפוש השערות באמצעות רשתות מתפתחות של סוכנים מדעיים אוטונומיים
arXiv
מערכות מרובות-סוכנים ובינה קולקטיבית

חיפוש השערות באמצעות רשתות מתפתחות של סוכנים מדעיים אוטונומיים

12 באוקטובר 2025

המחקר מראה איך ניתן לבנות פלטפורמות אוטונומיות שיכולות לנהל חיפוש מדעי ושיפורי ידע באנציקלופדיות נתונים גדולות ללא תלות רציפה במומחים אנושיים. בארגונים ובחברות מחקר זה יכול לשמש לגילוי אינדיקציות חדשות (signal discovery), ביצוע סריקות מהירות של היפותזות, הערכה מקדמת של תוצאות ראשוניות (triage) והפקת רעיונות למחקר המשכי. עבור מנהלי מחקר ומפתחים, זה מציע דרך להרחיב קצב המחקר, לייעל תהליכי סקירה פנימית ולייצר מטא-ידע על תקפות ושיטות הערכה אשר ניתן להטמיע בתהליכי קבלת החלטות.

Tennison Liu ואח'
קרא עוד ←
טכניקה מוכוונת החלטות (DOTechnique): הערכת תוקף המודל באמצעות ההקשר של מקבל ההחלטות
arXiv
קבלת החלטות עם AI

טכניקה מוכוונת החלטות (DOTechnique): הערכת תוקף המודל באמצעות ההקשר של מקבל ההחלטות

11 באוקטובר 2025

למנהלי מוצר, מקבלי מדיניות וארגונים: השיטה מספקת מסגרת מעשית להחליט מתי "מודל עובד" בשביל המטרה הארגונית. במקום לסמוך על מדדי דיוק כלליים (accuracy, RMSE וכו'), DOTechnique שואלת: האם החלטות שמיצרים מהממשק עם המודל תואמות לצרכי מקבלי ההחלטות? זה שימושי בהטמעת מערכות תמיכה בהחלטה (פיננסים, בריאות, מדיניות), בכתיבת דרישות רגולטוריות למערכות AI ובקביעת סטנדרטים להערכת סיכונים. עבור עסקים זה אומר פחות תלות במדד יחיד ויותר בדיקת התאמה לפעולה: האם המודל משנה החלטות לטובה, האם טעויות קריטיות מתרחשות, וכיצד להגדיר סף קבלה פרקטי לפני פריסה.

Raheleh Biglari ו-Joachim Denil
קרא עוד ←
אלגוריתם בהשראה קוונטית לפתרון חידות סודוקו ובעיית Max-Cut
arXiv
אחר

אלגוריתם בהשראה קוונטית לפתרון חידות סודוקו ובעיית Max-Cut

9 באוקטובר 2025

למנהלים ומנהלי מוצר/טכנולוגיה: המחקר מראה שיטות חדשות לפתור בעיות אופטימיזציה דיסקרטיות (כמו Max-Cut) ובעיות ההכרה/גביית כללים (כמו סודוקו) בעזרת ייצוג מטריצתי לחללים גדולים של פתרונות. המשמעות לעסקים היא אפשרות לכלים יעילים למציאת פתרונות מקורבים לבעיות NP-קשות שהן קריטיות בתחומים כמו ניתוב רשתות, חלוקת עומסים, תכנון רשתות וניתוח קונפיגורציות. הגישה אינה דורשת מחשוב קוואנטי אמיתי — היא עושה שימוש ברעיונות "קוואנטיים" (ייצוגים וסריקות מבוססות צפיפות) על מחשוב קלאסי, ולכן ניתן לשלב אותה במערכי חישוב קיימים כחלופה או תחליף לאלגוריתמים הסתברותיים קלאסיים (כמו simulated annealing) כדי לקבל פתרונות באיכות גבוהה בגודל בינוני-גדול.

Max B. Zhao ו-Fei Li
קרא עוד ←
סוכני בינה מלאכותית עבור משחק הקלפים Dhumbal: מחקר השוואתי
arXiv (abs/2510.11736)
למידת חיזוק

סוכני בינה מלאכותית עבור משחק הקלפים Dhumbal: מחקר השוואתי

9 באוקטובר 2025

למפתחים ומנהלי מוצר בתחום בינה מלאכותית ומשחקים: המחקר מספק מסגרת מעשית להשוואה ולבחירה של גישות פיתוח סוכן למשחקי קלפים אסטרטגיים. התוצאות מצביעות כי פתרון פשוט ומותאם-חוקים יכול להשיג תוצאות גבוהות במהירות ובמשאבים נמוכים, ולכן מתאים לפרויקטי מיתון מהיר או ליישומי בידור. לעומת זאת, טכניקות חיפוש ולמידה עמוקה (MCTS, ISMCTS, DQN, PPO) מציעות יכולת הסתגלות גבוהה יותר בסביבות לא ודאיות ובמצבים בהם יש מידע חלקי — חשוב עבור פיתוח סוכני מתחרים, שחקני בוטים מתקדמים וניתוח אסטרטגיות לשיפור חוויית משתמש או לאוטומציה של בדיקות איכות במשחקים דיגיטליים.

Sahaj Raj Malla
קרא עוד ←
מודלי בסיס יודעים כיצד להסיק מסקנות, מודלי חשיבה לומדים מתי
arXiv
מודלים גדולים

מודלי בסיס יודעים כיצד להסיק מסקנות, מודלי חשיבה לומדים מתי

8 באוקטובר 2025

המחקר מציע דרך פרקטית לשפר יכולות חשיבה והיסק של מערכות מבוססות מודלים גדולים בלי לבצע עדכוני משקל נרחבים: במקום “לסיים” או לאמן מחדש מודלים כבדים, אפשר להצמיע מנגנון היברידי שמזהה ומנצל את היכולות המוטמעות כבר בשלבי ה-pretraining ומוסיף רכיב קטן שמנווט מתי להפעיל אותן. לשוק ולמנכ"לים זה אומר: העלאה משמעותית בביצועים במשימות חישוביות ותבוניות (כמו פתרון בעיות מתמטיות) בעלות חישובית וניהולית נמוכה יותר, אינטגרציה קלה יותר בסביבות קיימות, ויכולת לשפר אמינות ופרשנות (explainability) מבלי לבצע תהליכי עדכון ארוכים ויקרים.

Constantin Venhoff ואח'
קרא עוד ←
מודלים מאוחדים של עולם: תכנון וחיזוי חזותי המבוססים על זיכרון לניווט חזותי
arXiv
רובוטיקה חכמה

מודלים מאוחדים של עולם: תכנון וחיזוי חזותי המבוססים על זיכרון לניווט חזותי

8 באוקטובר 2025

בעולמם של מנהלים ומקבלי החלטות טכנולוגיים: UniWM משפר יכולות ניווט של רובוטים ואמצעים אוטונומיים בתוך סביבות אמיתיות או מדומות. השיטה מאפשרת למערכות לזכור ולהשתמש בחוויות עבר כדי לדמיין תרחישים עתידיים ולתכנן מסלולים אמינים יותר, מה שמקטין תקלות, מצמצם זמן משימה ומשפר אמינות בפרויקטים בתחום מסחר אלקטרוני (מחסנים), דליוור, רובוטיקה שירותית, ומערכות מובילות כלי רכב. המשמעות העסקית היא עלות תפעול נמוכה יותר, פחות השגחה אנושית, ושיפור בביצוע משימות מורכבות בסביבות לא־מוכרות.

Yifei Dong ואח'
קרא עוד ←
אופטימיזציה של מערך המשלוחים ב־Quick Commerce תוך התחשבות בהערכת איכות המסלולים שנוצרו אוטומטית
arXiv
אינטגרציית ארגונית ותעשייתית של AI

אופטימיזציה של מערך המשלוחים ב־Quick Commerce תוך התחשבות בהערכת איכות המסלולים שנוצרו אוטומטית

8 באוקטובר 2025

להנהלות ולמנהלי תפעול: המסגרת מאפשרת להוסיף שלב איכותני ומדיניותי לבחינת מסלולי משלוח שנוצרים אוטומטית, בלי להסתמך רק על מדדי עלות/מרחק. המשמעות המעשית — קיצור זמן קבלת החלטות, אפשרות לסינון אוטומטי של מסלולים בעיתיים לפני ביצוע, חיסכון בעלויות תפעול, ושיפור עמידה ביעדי שירות (SLAs). ניתן להטמיע את השיטה כמנגנון חיתוך (filter) או וידוא-על (oversight) במערכות תכנון מסלולים ובפלטפורמות ניהול last-mile, וכן להשתמש ביכולות ההסבר של המודלים כדי להכשיר צוותי תפעול וליצור מדיניות ברורה יותר.

Milon Bhattacharya ו-Milan Kumar
קרא עוד ←
L2M-AID: הגנה סייבר-פיזית אוטונומית על ידי שילוב ההסקה הסמנטית של מודלי שפה גדולים עם למידת חיזוק רב-סוכנית (גרסת טרום-הדפס)
arXiv
אבטחת מידע ופרטיות ב-AI

L2M-AID: הגנה סייבר-פיזית אוטונומית על ידי שילוב ההסקה הסמנטית של מודלי שפה גדולים עם למידת חיזוק רב-סוכנית (גרסת טרום-הדפס)

7 באוקטובר 2025

מחקר זה מייצר כלי פרקטי לאנשי ניהול אבטחת מידע ותפעול במערכות תעשייתיות וחיישניות: L2M-AID מאפשר זיהוי אוטונומי מהיר וחכם של מתקפות על מערכות סייבר-פיזיות, הפחתת אזעקות שווא ושיפור זמן התגובה. המערכת מתאימה לארגונים שמפעילים תשתיות קריטיות (מפעלי מים, רשתות חשמל, מערכות בקרת תעשייה) ומבקשים להפחית עומס אנושי, להגדיל יציבות תהליכים פיזיים בזמן תגובה לאירוע ולשפר יכולת התאוששות ותפעול רציף תוך שמירה על בקרות ביטחון ותפעול.

Tianxiang Xu ואח'
קרא עוד ←
ProSEA: פתרון בעיות באמצעות סוכני חקירה (Exploration Agents)
arXiv (2510.07423)
מערכות מרובות-סוכנים ובינה קולקטיבית

ProSEA: פתרון בעיות באמצעות סוכני חקירה (Exploration Agents)

7 באוקטובר 2025

ProSEA יכול לשמש ארגונים המעוניינים בפיתרונות אוטומטיים למשימות מורכבות הדורשות פירוק, ניסוי ואינטגרציה של תוצרים משניים. במילים פשוטות — במקום סוכן יחיד שמנסה 'לפצח' בעיה גדולה, המערכת מחלקת את הבעיה למספר סוכנים מומחים שמנסים דרכי פתרון שונות במקביל; מנהל העל מקבל, משלב ומכוון את המאמצים הללו באופן דינמי. עבור מנהלים ומשקיעים זה אומר: מהירות פיתוח גבוהה יותר לפרויקטים ניסיוניים (proof-of-concept), יכולת פתרון בעיות רב-תחומיות (למשל תכנון לוגיסטי + בקרת רובוטיקה + קביעת מדיניות), ירידה בסיכון כישלון מלא (בעזרת פתרונות ביניים שניתנים לשיפור) ואפשרות לשימוש במערכות אלו כחלק מקו מוצר חכם: אוטומציה תעשייתית, סוכנים מחקריים בחברה, שיפור תהליכי תכנון אסטרטגי, ועזרי פיתוח תוכנה חכמים.

William Nguyen ואח'
קרא עוד ←
הערכת LLMs עבור Process Model Analysis ו-Optimization
arXiv
מודלים גדולים

הערכת LLMs עבור Process Model Analysis ו-Optimization

7 באוקטובר 2025

מחקר זה בוחן כמה LLMs יעילים כעוזרים לניתוח ושיפור של מודלים ארגוניים (כדוגמת BPMN). למנהלי מוצר, CIO ומובילי תהליכים: כלים מבוססי LLM יכולים להסביר תהליכים למשתמשים לא-טכניים, לזהות בעיות לוגיות נפוצות, להציע שיפורים (קיצוץ צעדים, שינוי סדר פעולה, איתור צווארי בקבוק) ולסייע ביצירת תיעוד ודרישות. עם זאת יש לבצע בדיקות אנושיות ואימות פורמלי לפני יישום שינויים, מאחר שלעתים המודל עלול להציע המלצות שגויות או להמציא עובדות (hallucinations). משמעות פרקטית: שימוש ב-LLM ככלי עזר יפחית זמן אנליזה ויגביר יצירתיות, אך לא יחליף מומחים בתחומי הבטיחות ותהליכי ליבה.

Akhil Kumar ואח'
קרא עוד ←
פחות זה יותר: בחירה אסטרטגית של מומחים עדיפה על מורכבות אנצמבל בחיזוי תנועה
arXiv
למידה חישובית

פחות זה יותר: בחירה אסטרטגית של מומחים עדיפה על מורכבות אנצמבל בחיזוי תנועה

7 באוקטובר 2025

המחקר רלוונטי למנהלי מוצר, מהנדסי תחבורה וארגוני ערים חכמות המעוניינים בשיפור תחזיות עומסי תנועה בזמן אמת מבלי להגדיל משמעותית עלויות חישוב. במקום להריץ אנסמבל גדול של מודלים בכל בזמן ריצה, ניתן לפרוס כמה מומחים ותהליך בחירה חכם שיבחר עבור כל מקרה מועמד מתאים — מה שמוריד השהיות חישוביות, מחייב פחות משאבים ענניים ופותר צורך בכוונון מורכב של אנסמבל. המשמעות העסקית: מערכות ניתוח תנועה מדויקות יותר ושלובות בקלות במערכות ניהול תעבורה, צמצום עלויות תשתית ותגובה מהירה לאירועי עומס.

Walid Guettala ואח'
קרא עוד ←
עמדה: הבינה המלאכותית תשנה את הנוירופסיכולוגיה באמצעות תאומים דיגיטליים לבריאות הנפש (Mental Health Digital Twins) עבור טיפול נפשי דינמי – במיוחד בהקשר של ADHD
arXiv
בינה מלאכותית רפואית ובריאות דיגיטלית

עמדה: הבינה המלאכותית תשנה את הנוירופסיכולוגיה באמצעות תאומים דיגיטליים לבריאות הנפש (Mental Health Digital Twins) עבור טיפול נפשי דינמי – במיוחד בהקשר של ADHD

7 באוקטובר 2025

המחקר מציע קונספט שמנהל בכיר או מוביל מוצר בארגון בריאותי יכול לממש כדי לשפר תהליכי טיפול: בניית "תאום דיגיטלי" לכל מטופל שיאגד נתוני חיישנים, תוצאות מבחנים, נתוני רושם רפואי ודיווח מטופל, וידלג להמלצות טיפול דינמיות בהתאמה אישית. המשמעות העסקית: יכולת לנטר מטופלים מרחוק, להפחית אשפוזים או ביקורי חירום, לייעל תהליכי אבחון וטיפול (לדוגמה במטופלי ADHD), ולהציע שירותים פרימיום של טיפול מותאם אישית. עם זאת יש עלויות פיתוח, דרישות רגולציה וחששות אתיים שדורשים מדיניות נתונים, שקיפות ושילוב אנשי מקצוע קליניים לקבלת החלטות סופיות.

Neil Natarajan ואח'
קרא עוד ←
פרטיות במערכת הבריאות: השפעת הסברים על חששות לפרטיות ועל גילוי עצמי כלפי טכנולוגיות שיחה
Journal of Operations Management
בינה מלאכותית רפואית ובריאות דיגיטלית

פרטיות במערכת הבריאות: השפעת הסברים על חששות לפרטיות ועל גילוי עצמי כלפי טכנולוגיות שיחה

5 באוקטובר 2025

למנהלים ולמפתחי מוצר: המחקר מציע דרך פרקטית לשפר איסוף מידע רפואי קריטי באמצעות צ'אטבוטים על ידי הוספת הסברים קונקרטיים על מטרת שאלות פרטיות. בעזרת הסברים ('למה אנו שואלים') ניתן להוריד חששות פרטיות ולשפר נכונות המטופל למסור מידע אמיתי ועמוק, מה שיתרום לאבחון מדויק, טיפול מותאם אישית ויעילות תפעולית. ההנחיות רלוונטיות לעיצוב ממשקי CA, מדיניות פרטיות, ועמידה בתקנות (GDPR/AI Act).

Hashai Papneja ו-Sarv Devaraj
קרא עוד ←
LANG-PINN: משפה לרשתות עצביות מוּדעות פיזיקה באמצעות מסגרת מרובת סוכנים
arXiv
למידה עמוקה

LANG-PINN: משפה לרשתות עצביות מוּדעות פיזיקה באמצעות מסגרת מרובת סוכנים

2 באוקטובר 2025

המחקר מראה איך מודלים לשוניים גדולים יכולים להפוך את תהליך הפיתוח של רשתות עצביות שמוכוונות פיזיקה (PINNs) לאוטונומי וחוזר. למנהלים וטכנולוגים המנהלים פרויקטים בחברות עוסקות סימולציות פיזיקליות (אנרגיה, ננוטכנולוגיה, הנדסה, מזג-אוויר וכו') המשמעות היא: (1) קיצור משמעותי בזמן פיתוח והטמעה של מודלים לפתרון PDEs, (2) שיפור ביצועים ואמינות של המודלים המפותחים, ו-(3) הפחתת התלות במומחי דומיין להנדסת אובדן/ארכיטקטורה. ארגונים יכולים לנצל מסגרת כזו כדי להאיץ מודלים סימולציה, לחסוך בעלויות מהנדסים ולשפר דיוק חיזויים במערכות מבוססות פיזיקה.

Xin He ואח'
קרא עוד ←
פענוח מודע לאמת: גישה מבוססת לוגיקת תוכניות להפקת טקסט עובדתי
arXiv
עיבוד שפה טבעית

פענוח מודע לאמת: גישה מבוססת לוגיקת תוכניות להפקת טקסט עובדתי

2 באוקטובר 2025

למנהל/ת או איש/ת עסקים: השיטה מאפשרת לשפר את האמינות של טקסטים שנוצרים על־ידי מודלי שפה (למשל סיכומים, תשובות ללקוחות, דוחות אוטומטיים) בלי לדרוש אימון מחדש יקר של המודל. במקום זאת, מוסיפים שלב פיענוח חכם שמוודא עובדות מול ידע חיצוני ומתקן פלט בזמן אמת. המשמעות היא הפחתת מידע שגוי במוצרים מבוססי AI, פחות תקלות רגולטוריות/מוניטיניות, ושיפור אמון הלקוחות במערכות אוטומטיות — כל זאת עם אפשרות הטמעה מהירה במערכות קיימות.

Faruk Alpay ו-Hamdi Alakkad
קרא עוד ←
פרספקטיבה אלגוריתמית תלוית מידע על בעיית קיבוע הסמל
arXiv
אינטראקציית אדם-AI

פרספקטיבה אלגוריתמית תלוית מידע על בעיית קיבוע הסמל

1 באוקטובר 2025

למנהלים ומקבלי החלטות: המחקר מספק מסגרת רעיונית להבנה מתי וכיצד מערכות AI יכולות 'להבין' משמעות של תגים וסמלים בעולם הממשי. זה שימושי לפיתוח סוכנים אוטונומיים ורובוטים שצריכים לקבל החלטות מבוססות ידע מייצג ולא רק לדקלם תבניות; לפרויקטיי NLP שבהם דרוש אינטגרציה בין שפה להתנסות בעולם; ולעיצוב מערכות למידה שמחייבות איסוף נתונים פרובקטיבי (active exploration) ותהליכי דחיסה/סינתזה של ייצוגים. מבחינה עסקית — ההמלצה היא להשקיע במנגנוני איסוף נתונים כוונתי ובאדריכלות למידת ייצוגים שמדגישה חיזוי ודחיסה, כדי לשפר אמינות ופרשנות של החלטות AI במערכות קריטיות.

Zhangchi Liu
קרא עוד ←
RefineShot: חשיבה מחודשת על הבנת קולנוע עם הערכת מיומנויות יסוד
arxiv
ראייה ממוחשבת

RefineShot: חשיבה מחודשת על הבנת קולנוע עם הערכת מיומנויות יסוד

1 באוקטובר 2025

מחקר זה מספק כלים למדידה ולשיפור של מערכות שמנתחות וידאו ושוטים קולנועיים — שימושי לחברות מדיה, פלטפורמות וידאו ותוכן, אולפני הפקה וכל מי שמעוניין באוטומציה של ניתוח תוכן חזותי מסורתי. ערכת המדידה (ShotBench) מאפשרת להעריך יכולות בהבנת סגנון וצילום (למשל – זוויות, סוגי שוטים, עריכת קטעים), והמודל RefineShot/ShotVL משפר ביצועים במשימות אלו. המשמעות העסקית: שיפור חיפוש תוכן, חיתוך אוטומטי לערוצים שיווקיים, כלי עזר ליוצרי וידאו ולניתוח איכות תסריטים/בימוי, ואפשרות למדידת איכות חזותית אוטומטית לצורכי ארכיון וקטלוג.

Hang Wu ואח'
קרא עוד ←
BrowserArena: הערכת סוכני LLM במשימות ניווט באינטרנט בעולם האמיתי
arxiv
מודלים גדולים

BrowserArena: הערכת סוכני LLM במשימות ניווט באינטרנט בעולם האמיתי

1 באוקטובר 2025

המחקר שימושי למנהלים ולמובילי מוצר בתחומי אוטומציה ו-RPA: BrowserArena מספק כלי ומדדים להעריך עד כמה סוכנים מבוססי LLM יכולים לבצע משימות אינטרנט אמיתיות (חיפוש מידע, מילוי טפסים, אינטראקציה עם ממשקי משתמש). זה מאפשר הבחנה בין מודלים שמתאימים לפריסה בעבודות שגרתיות ופרוצדורות מול אלה שזקוקים לפיקוח אנושי בגלל כשלי בטיחות (כמו CAPTCHA או באנרים). עבור עסקים — הכלי מסייע בבחירת מודל, בתכנון ניסויי שילוב (A/B), ובהבנת סיכונים תפעוליים לפני אינטגרציה של סוכנים אוטונומיים במערכות לקוחות, שירות עצמי ומעקב תוכן.

Sagnik Anupam ואח'
קרא עוד ←
למידה בתוך הקשר בטוחה ויעילה באמצעות בקרת סיכונים
arxiv
מודלים גדולים

למידה בתוך הקשר בטוחה ויעילה באמצעות בקרת סיכונים

1 באוקטובר 2025

למנהלים ולמוליך פרויקטים בתחום AI: המחקר מציע כלי פרקטי להגביר את האמינות והבטיחות של שימוש ביכולות in‑context של מודלים גדולים (למשל LLMs) על ידי בחירה שיטתית של הדגמות שמגבילה תוצאות גרועות. המשמעות העסקית: ניתן להקטין סיכונים תפעוליים (תשובות שגויות/מסוכנות) ולחסוך בהיקף הדגמות הנדרש, בלי לשנות את המודל עצמו — מה שמאפשר פריסה מהירה ובטוחה יותר בשירותים חיצוניים ובמוצרים קריטיים.

Andrea Wynn ואח'
קרא עוד ←
מבנה ההיגיון עבור כללים מורכבים מעבר לייצוגים שטוחים
arXiv
עיבוד שפה טבעית

מבנה ההיגיון עבור כללים מורכבים מעבר לייצוגים שטוחים

30 בספטמבר 2025

למנהלים ומקבלי החלטות: השיטה DAT מספקת דרך מובנית להפיכת מודלים לשוניים לכלים אמינים יותר בקבלת החלטות מבוססות כללים (תקנות, מדיניות, חוקים משפטיים, נהלי שירות). במקום לתת למודל 'לחשוב בקול' באופן חופשי, DAT מחלקת את המשימה לשלבים מובניים שמקטינים טעויות הנובעות מערבוב ראיות או הסחות דעת. המשמעות העסקית: יישום DAT יכול להקטין שגיאות בפרשנות מדיניות/רגולציה, לשפר דיוק במערכות אוטומטיות של בדיקות תאימות, ולייעל תהליכי אוטומציה של שירות לקוחות / דרישות רגולטוריות על ידי הפיכת התשובות לאיסוף ראיות מוסבר ובר-בדיקה.

Zhihao Yang ואח'
קרא עוד ←
בינה מלאכותית מעצבת מחדש את המודלים הפיננסיים
nature
עיבוד שפה טבעית

בינה מלאכותית מעצבת מחדש את המודלים הפיננסיים

30 בספטמבר 2025

המחקר ממחיש איך ארגוני השקעות, בתי ניתוח ונציגי ניהול סיכונים יכולים לשדרג מודלים פיננסיים קיימים בלי לוותר על ההסבריות הנדרשת לרגולציה. במקום להחליף את המודלים הקיימים ב'קופסה שחורה', אפשר להטמיע רכיבי AI (בעיקר NLP ו-LLM) כדי: (1) להפיק סנטימנט ודעות שוק מדוחות וחדשות בזמן אמת ולהתאים ציפיות תשואה; (2) לייצר אותות ודירוגי ביטחון שמשולבים ב-Black-Litterman; (3) לזהות שינויים במשטרי שוק ולעדכן מטריצות סיכונים; (4) לפרופיל לקוחות בהתאם לסגנון סיכון בהתבסס על טקסט. המשמעות לעסקים: שיפור תוצאות השקעה, ניהול סיכונים גמיש יותר, שמירה על יכולת הסברית מול רגולטורים, ואוטומציה של משימות אנליטיות הנדסיות בקנה מידה גדול.

Frank Xing
קרא עוד ←
חשיבה מהירה, איטית ומטה-קוגניטיבית בבינה מלאכותית
nature
אינטראקציית אדם-AI

חשיבה מהירה, איטית ומטה-קוגניטיבית בבינה מלאכותית

30 בספטמבר 2025

המחקר מדגים שיטה פרקטית לשלב רכיבים מהירים (למידה מבוססת ניסיון) ורכיבים איטיים (תכנון/היסק) בעמדת קבלת החלטות אוטונומית, עם מודול מטה‑קוגניטיבי שמאזן בין מהירות לאמינות. עבור מנהלים ומקבלי החלטות בארגונים: גישה זו מאפשרת מערכות חכמות שיחסכו זמן חישוב כשאפשרי (כי ילמדו לטפל במשימות שגרתיות במהירות), ובאותה עת יפעילו מודולים חישוביים כבדים במצבי סיכון או חוסר ביטחון כדי לשפר איכות ותאימות למדיניות. זה שימושי ברובוטיקה, תכנון לוגיסטי, סוכני שירות אוטומטיים ובכל מערכת שבה יש צורך לאזן בין ביצועים מהירים לבין בטיחות ואמינות תוך חיסכון בעלויות חישוב.

M. Bergamaschi Ganapini
קרא עוד ←
מודלים מולקולריים מאומנים מראש עם מיסוך קבוצות פונקציונליות אקראיות
nature
למידה עמוקה

מודלים מולקולריים מאומנים מראש עם מיסוך קבוצות פונקציונליות אקראיות

30 בספטמבר 2025

המחקר מפתח כלי לשיפור חיזוי תכונות מולקולריות (טוקסיות, מסיסות, מדדי קוונטום וכו') ללא צורך במידע תלת‑ממדי מדויק. למנהלים בתעשיית תרופות וכימיה משמעותי: ניתן להשתמש ב‑MLM-FG לקידום סינון וירטואלי (virtual screening), תעדוף מולקולות להמשך בדיקות ניסוייות, סיוע ברה‑דיזיין של לידים ותמיכה בפעולות ריפרופוזיציה. היתרון המעשי הוא חיסכון בעלות וזמן שקשורים לחישוב או ניסוי של קונפורמציות 3D, ושיפור דיוק החיזוי במטלות שבהן קבוצות תפקודיות חשובות.

Tianhao Peng
קרא עוד ←
שיכוך אקראי מפוצל דינמי כללי להתכנסות מהירה באופטימיזציית למידה עמוקה
nature
למידה עמוקה

שיכוך אקראי מפוצל דינמי כללי להתכנסות מהירה באופטימיזציית למידה עמוקה

30 בספטמבר 2025

האלגוריתם מיועד לשפר את האימון של מודלים גדולים בעסק: מאיצי אימון שמקצרים זמן פיתוח ומשאבי מחשוב, מגדילים דיוק וביצוע במערכות ראייה, ופותחים אפשרות לאופטימיזציה אוטומטית של מודלים קלאסיים (SVM, k‑means) בלי grid‑search. משמעויות פרקטיות: הפחתת עלויות חומרה ו‑GPU, השגת ביצועים טובים יותר בפרויקטים בתחום ראייה ממוחשבת, NLP וביו‑מד, ועמידות טובה יותר לשגיאות תיוג (חשוב בפרויקטי נתונים לא נקיים). למנהלים: טכנולוגיה זו יכולה לקצר זמני השקה, לצמצם צורך בכיול ידני של מאמצי אימון, ולהשיג תוצאות מרשימות על נתונים גדולים ורגישים לרעש.

Matthew Korban
קרא עוד ←
מידול אופטימיזציה באמצעות יישור מעוגן סמנטי
arXiv
למידה עמוקה

מידול אופטימיזציה באמצעות יישור מעוגן סמנטי

27 בספטמבר 2025

המחקר מעניין מנהלים ומפתחים בארגונים המיישמים אוטומציה של בניית מודלים אופטימיזציוניים (למשל לתזמון, תכנון, תמחור, לוגיסטיקה). במקום לתקן ידנית מודלים שנוצרו אוטומטית על-ידי מודל שפה, SAC-Opt автоматית מזהה אילו רכיבים סמנטיים שגויים ומתקנת רק אותם — מה שמוריד זמן תיקון ידני, מונע שגיאות קריטיות ומגביר את האמינות. בשילוב עם LLM בארגונים ניתן להפיק מודלים מתמטיים מדויקים יותר לשימוש בבקרים או במערכות קבלת החלטות, לקצר פיתוח ולשפר דיוק תמחור ותכנון.

Yansen Zhang ואח'
קרא עוד ←
קוגניציה מובנית עבור אינטליגנציה התנהגותית בסוכני מודל שפה גדולים: מחקר מקדמי
arXiv
מודלים גדולים

קוגניציה מובנית עבור אינטליגנציה התנהגותית בסוכני מודל שפה גדולים: מחקר מקדמי

22 בספטמבר 2025

המחקר מציע דרך לשפר את אמינותם ויכולת הניתוח-הפעולה של סוכני בינה מלאכותית שמבוססים על מודלים שפתיים גדולים. עבור מנהלים ומקבלי החלטות בארגונים: הטכנולוגיה יכולה להקטין כישלונות בביצוע אוטומציות מורכבות, לשפר ביצועי תהליכים אוטונומיים שמשלבים חיפוש מידע, שליפת נתונים וביצוע פעולות חיצוניות (שליחת דוא"ל, ביצוע טרנזקציות, שימוש ב-APIs), ולהפחית סיכונים הנובעים מטעויות לוגיות או קריאות מיותרות לכלים. המשמעות העסקית היא תפעול אוטומטי מדויק יותר, חיסכון בזמן הפיתוח (פחות נסיונות ותיקונים), ושיפור אמינות במערכות שירות לקוחות, סוכנויות דיגיטליות ורובוטיקה תוכנתית.

Myung Ho Kim
קרא עוד ←
קידוד כללים וציות במודלים של שפה גדולה: ניתוח תיאורטי אינפורמטיבי
arXiv
מודלים גדולים

קידוד כללים וציות במודלים של שפה גדולה: ניתוח תיאורטי אינפורמטיבי

22 בספטמבר 2025

המאמר שימושי למנהלים ומובילי מוצר העוסקים בשילוב מודלי שפה גדולים במוצרים ובשירותים רגישים (שירות לקוחות, אפליקציות בריאות, כלי תמיכה בהחלטות ארגוניות וסוגיות ציות רגולטוריות). הוא מספק כלים להתוות מדיניות ניסוח כללים (prompt engineering / rule design) שמפחיתים סיכונים של סטיות/היענות רעה, ומציע מדדים לכימות איכות הציות של המודל. עבור אנשי אבטחה ורגולציה: המסגרת מסייעת להעריך את האמינות של מנגנוני ציות ולתכנן בדיקות ושיפורים בתהליך הכשרת המודלים (instruction tuning, RLHF) וביישום כללי בטיחות.

Joachim Diederich
קרא עוד ←
האם ארכימדס היה צועק "מצאתי!" עם אלגוריתמים? היד הנסתרת של עיצוב אלגוריתמי ביצירת רעיונות, בהיווצרות "בועות אידיאציה", וכיצד מומחים יכולים לנפץ אותן
Academy of Management Journal
אינטראקציית אדם-AI

האם ארכימדס היה צועק "מצאתי!" עם אלגוריתמים? היד הנסתרת של עיצוב אלגוריתמי ביצירת רעיונות, בהיווצרות "בועות אידיאציה", וכיצד מומחים יכולים לנפץ אותן

16 בספטמבר 2025

למנהלים ואנשי עסקים: המחקר מראה שכשמיישמים מערכות חיפוש והמלצה בארגונים (לדוגמה כלי מחקר שוק, מערכות תמיכה ביצירת מוצרים, פלטפורמות חדשנות פתוחה), עיצוב האלגוריתם קובע האם המערכת תייצר רעיונות חזרתיים או תעודד קפיצות רעיוניות. שימוש באלגוריתמים שמעדיפים חיפוש חוקרני (exploration) יכול לחזק את תרומת המומחים, להוריד הטיות אישוש ולהגביר מגוון רעיוני — מה שיכול להוביל לחדשנות איכותית יותר. עבור צוותי R&D, פיתוח מוצר ופיתוח אסטרטגיה, משמעותי להעדיף כלי חיפוש/המלצה שמטפחים רקומבינציה של רעיונות במקום להציף תמיד את אותו גוף ידע; כמו כן יש לשלב בעלי מומחיות באופן פעיל כדי "לפורץ" בועות רעיוניות ולהרחיב את שטח החיפוש הארגוני.

Moran Lazar ואח'
קרא עוד ←
גיוס הרוב הדומם: הרחבת השיח ותמיכת הקהל בחדשנות יזמית
Strategic Management Journal
אחר

גיוס הרוב הדומם: הרחבת השיח ותמיכת הקהל בחדשנות יזמית

14 בספטמבר 2025

מנהל מוצר, מייסד סטארט‑אפ או מנהל קהילה מקוון יכול להשתמש בממצאי המחקר כדי לתכנן תגובות ציבוריות חכמות: במקום להגיב תמיד לפי הטון של המגיבים הפעילים, כדאי להוסיף פרשנויות משלימות (למשל הדגשת ערך אמנותי במקום אך־רק הסבר טכני), אבל בזהירות — הרחבה מתונה מרחיבה את קהל התומכים, בעוד שהרחבה־יתר מבלבלת או מרחיקה תומכים קיימים. בנוסף, יש להתאים את מידת ההרחבה לפי מידת הייצוגיות של המגיבים הפעילים ביחס לקהל הצופה — ככל שהמגיבים משקפים טוב יותר את הקהל השקט, מרחב ההרחבה האפקטיבי הוא צר יותר.

Jamie Seoyeon Song
קרא עוד ←
Paper2Agent: חשיבה מחדש על מאמרי מחקר כ-AI Agents אינטראקטיביים ואמינים
arXiv:2509.06917v1
אינטראקציית אדם-AI

Paper2Agent: חשיבה מחדש על מאמרי מחקר כ-AI Agents אינטראקטיביים ואמינים

7 בספטמבר 2025

המחקר מתאים במיוחד לארגונים מחקריים וחברות תוכנה שמעוניינות להנגיש שיטות מתמטיות ומודלים מתקדמים לצוותים לא-מפתחים. במקום שלבי התקנה מורכבים, צוותים יכולים לשאול בשפה טבעית את 'המאמר-סוכן' להפעיל צינורות, להריץ ניתוחים על נתונים חדשים ולהפיק דוחות מוכנים לפרסום. עבור מנהלים, המשמעות היא הקטנת חסמי אימוץ לטכנולוגיות חדשות, שיפור שיחזור ניסויי נתונים, מהירות הגעה לתוצרים ויכולת לשלב כמה מאמרים/כלים בקמפוס טכנולוגי אחד.

Jiacheng Miao ואח'
קרא עוד ←
פרופיל מחזור התא מבוסס על צורות פולס ציטומטריות באמצעות רשתות נוירונים עמוקות
nature
בינה מלאכותית רפואית ובריאות דיגיטלית

פרופיל מחזור התא מבוסס על צורות פולס ציטומטריות באמצעות רשתות נוירונים עמוקות

31 באוגוסט 2025

המחקר מראה כיצד לשלב חישה אופטי-טמפורלית מתקדמת עם למידה עמוקה כדי לבצע סיווג מחזור התא ללא צורך בסמנים פלואורסצנטיים. מבחינה מעשית, זה יכול להאיץ ולקזז עלויות בניסויים ביולוגיים ותעשייתיים שבהם תיוג תאי אינו רצוי (חיים/חיידקים) או בלתי זמין; לשמש לשיפור איכות המיון והתהליך בסורטרים של תאים; ולשפר תהליכי בדיקות בתרופות, שליטה בתהליך ביוטכנולוגי וזיהוי תאים נדירים (לדוגמה תאי גידול). עבור מנהלים וטכנולוגים, גישה זו מאפשרת הגברת תפוקה, הפחתת תלות בכימיקלים ובחומרים, והתאמה מהירה יותר לצרכי סקרינג ויישומי בקרת איכות בתעשייה.

Vinod Devaraj
קרא עוד ←
לקראת הסבר עצמי אמין ומיושר אנושית של מודלים עמוקים
nature
בינה מלאכותית מסבירה

לקראת הסבר עצמי אמין ומיושר אנושית של מודלים עמוקים

31 באוגוסט 2025

למנהלים ואנשי עסקים: המחקר מפתח שיטה שמאפשרת להצמיד הסברים ברורים ואמינים להחלטות של מערכות למידת-עמוק בלי לוותר על ביצועים. משמעות הדבר: פריסת מערכות AI קריטיות (כמו סיווג תכנים, דירוג אשראי, זיהוי הונאות) יכולה להתבצע עם יכולת להסביר החלטות ברמת תכונות ניתנות להבנה אנושית, לשפר אמון רגולטורי ולסייע בזיהוי הטיות. SELIN מקל תחקור שגיאות מודל, משפר עמידות נגד תיוג רעש ומשמש כלי לשילוב הדרכה אנושית (prior rules) וליצירת כללים מותאמים למדיניות ואכיפה פנימית.

Seungeon Lee
קרא עוד ←
LifeGPT: מודל טרנספורמר גנרטיבי שאומן מראש ואגנוסטי לטופולוגיה עבור אוטומטים תאיים
nature
למידה עמוקה

LifeGPT: מודל טרנספורמר גנרטיבי שאומן מראש ואגנוסטי לטופולוגיה עבור אוטומטים תאיים

31 באוגוסט 2025

המחקר מראה שניתן להשתמש בופרטקל של מודלי טרנספורמר לא רק בעיבוד טקסט אלא גם כמכשיר כללי ללמידת כללים מקומיים במערכות דינמיות דיסקרטיות. מבחינה מעשית, גישות כמו LifeGPT מאפשרות: (1) בניית דגמיםחיזוי מהירי של מערכות מבוססות חוקים מקומיים ללא צורך בהטמעת טופולוגיה ידנית; (2) יצירת כלים לאיפיון והסקת חוקים מתצפיות מרחביות-זמניות (inverse design); (3) סימולציות חלופיות בהן דיוק נקודתי אינו הכרחי (מייצגים סטטיסטיים או coarse-grained); (4) פיתוח מערכות לניתוח תהליכים ביולוגיים, חומריים או סביבתיים שבהם אינטראקציות מקומיות מניבות דינמיקה גלובלית מורכבת. למנהלים: זה מאפשר קיצור פיתוח סימולטורים ויצירת מודלים גנרטיביים שיכולים לתת אינסייטים על חוקים מקומיים ממידע אמיתי, אולם יש לשים לב לצורך בנתונים מגוונים ובקרה על שגיאות מצטברות בריצות רקורסיביות.

Jaime A. Berkovich
קרא עוד ←
ניסוח MRP עבור למידה מונחית: מודלים מוכללים של למידת הפרשי זמן
Journal of Artificial Intelligence Research (JAIR)
למידת חיזוק

ניסוח MRP עבור למידה מונחית: מודלים מוכללים של למידת הפרשי זמן

20 באוגוסט 2025

המחקר מראה שניתן ליישם כלים של למידת חיזוק (בפרט עדכוני Temporal Difference) על בעיות של למידה מפוקחת על ידי ייצוג נקודות הנתונים כמצבים ב-MRP. עבור מנהלים ומקבלי החלטות בטכנולוגיה: שיטה זו יכולה להציע מודלים מדויקים יותר במצבים בהם דאגמות ונתונים קשורים זה לזה (למשל סדרות זמן, נתוני משתמשים תלויי הקשר, או מערכות בהן דגימות אינן עצמאיות). המשמעות העסקית — יכולת לקבל תחזיות והערכות מדויקות יותר במערכות המלצה, חיזוי ביקושים, או מערכות בקרה אירועיות כאשר קיים קורלציה בין דוגמאות; כמו כן מאפשרת הטמעה של כלים ופרקטיקות מ-RL (כגון עדכונים מקוונים ו-TD) לתחומי SL קיימים.

Yangchen Pan ואח'
קרא עוד ←
שזירה בין מצבי ידע ממוקמים (Situated) ואלגוריתמיים: פרספקטיבה של תחום השיפוט הארגוני (Workplace Jurisdiction)
Academy of Management Journal
אינטראקציית אדם-AI

שזירה בין מצבי ידע ממוקמים (Situated) ואלגוריתמיים: פרספקטיבה של תחום השיפוט הארגוני (Workplace Jurisdiction)

4 באוגוסט 2025

המחקר רלוונטי למנהלים ומקבלי החלטות שמעוניינים להטמיע טכנולוגיות מבוססות אלגוריתמים (כולל מערכות למידה חישובית ו-AI) בעבודת מומחים. הוא מדגיש שהטמעה מוצלחת דורשת תכנון ארגוני שמעבר לממשק משתמש יחיד: יש לארגן מחדש משימות, להבהיר מי בעלי הסמכות להפיק ולקבל מסקנות, ולעצב פרקטיקות תיווך בין קבוצות מקצועיות שונות. מסקנות המחקר עוזרות לקבוע מדיניות אימון, הגדרות תפקידים, נהלי תיעוד ומדדי אמינות חדשים שמפחיתים התנגדויות, מגבירים קבלת ידע אלגוריתמי ומשפרים תיאום בין צוותים (לדוגמה: רדיולוגים, טכנאים, מנהלי IT ובעלי עניין קליניים).

Bomi Kim
קרא עוד ←
ללמוד איך להצביע עם עקרונות: תובנות אקסיומטיות לגבי החלטות קולקטיביות של רשתות נוירונים
Journal of Artificial Intelligence Research (JAIR)
קבלת החלטות עם AI

ללמוד איך להצביע עם עקרונות: תובנות אקסיומטיות לגבי החלטות קולקטיביות של רשתות נוירונים

4 באוגוסט 2025

המחקר מדגים כיצד ניתן לבחון ולבנות מערכות אוטומטיות שמבצעות החלטות קולקטיביות (לדוגמה: דירוגים, המלצות קבוצתיות, מערכות הצבעה דיגיטלית או קיבוץ החלטות בארגונים) באופן שקוף וניתן לבקרה באמצעות אקסיומות ברורות. עבור מנהלים וארגונים זה אומר שניתן להעריך לא רק האם מערכת "נכונה" לפי תוצאה רצויה, אלא גם האם הדרך שבה היא מקבלת החלטות תואמת לערכים ארגוניים (כמו ניטרליות, היענות לרוב, חוסר-הטיה). ניתן להשתמש בגישה לייצר כללים מותאמים למשקעים עסקיים, לזהות מצבי הטיה ולנסח דרישות רגולטוריות ותקניות עבור מערכות החלטה קולקטיביות.

Levin Hornischer ו-Zoi Terzopoulou
קרא עוד ←
MA-LAMA: ניצול אופי מרובה הסוכנים של בעיות תכנון זמני
Journal of Artificial Intelligence Research (JAIR)
מערכות מרובות-סוכנים ובינה קולקטיבית

MA-LAMA: ניצול אופי מרובה הסוכנים של בעיות תכנון זמני

3 באוגוסט 2025

למנהלים ומהנדסי מוצר בעולמות תכנון אוטונומי ורובוטיקה, MA-LAMA מציע דרך להפחית עלויות ולשפר תכנונים במערכות שבהן משימות מבוצעות במקביל על־ידי מספר סוכנים. במקום להשקיע משאבים רבים בלוגיקה תזמונית מסובכת בזמן החיפוש, אפשר לפרק את הבעיה לרכיבים רב‑סוכניים, להקצות מטרות על בסיס עלות ולנתח אינטראקציות מוקדמות. משמעותית לפרקטיקה העסקית — פתרון מסוג זה יכול להוביל לתכניות זולות יותר, לתזמון מקבילי יעיל יותר ושיפור ביצועים במערכות לוגיסטיות, ניהול צי רובוטי, ייצור חכם ואוטומציה תעשייתית שבהן יש צורך בתיאום בין ישויות רבות.

J. Caballero Testón ו-Maria D. R-Moreno
קרא עוד ←
פיתוח בינה מלאכותית יוצרת (Generative AI) לשיתוף ביצירת ערך (Value Co-Creation): ניסוי שדה רנדומלי מבוסס-התערבות בהקשר בריאותי
Journal of Operations Management
בינה מלאכותית רפואית ובריאות דיגיטלית

פיתוח בינה מלאכותית יוצרת (Generative AI) לשיתוף ביצירת ערך (Value Co-Creation): ניסוי שדה רנדומלי מבוסס-התערבות בהקשר בריאותי

2 באוגוסט 2025

עבור מנהלים ובעלי החלטה בבתי חולים ובארגוני בריאות, המחקר מראה שיישום GenAI שעוצב בשיתוף עם מטופלים וצוותים רפואיים יכול להפחית חרדה לאחר שחרור ולהפחית משמעותית אשפוזים חוזרים בטווח הקצר — מה שמוביל לחיסכון במשאבי אשפוז ולשיפור חוויית המטופל. הגישה המוצעת מדגישה תכנון שיתופי (co-design) והטמעה במסגרת רשת של בעלי עניין (כולל עובדים, מטופלים, טכנולוגיה ונהלים), ולכן היא שימושית כשיטה מעשית לפריסה של פתרונות דיגיטליים בפריפריה ובמסגרות עם משאבים מוגבלים. מנהלים צריכים לשקול תהליכי אימות קליני, קבלת אמון משתמשים, אינטגרציה בתהליכי עבודה קיימים והקצאת משאבים לגיבוי ופיקוח רגולטורי בעת הכנסת GenAI לשירותים קליניים.

Yanwu Song ואח'
קרא עוד ←
על קצב ההתכנסות מסדר O(√d T^{1/4}) של RMSProp והרחבתו עם מומנטום (Momentum) כפי שנמדד בנורמת L1
Journal of Machine Learning Research
למידה עמוקה

על קצב ההתכנסות מסדר O(√d T^{1/4}) של RMSProp והרחבתו עם מומנטום (Momentum) כפי שנמדד בנורמת L1

31 ביולי 2025

המחקר מספק מסגרת תיאורטית שמסבירה מדוע RMSProp ומנגנון המומנטום הפופולרי שלו מצליחים בעבודה מעשית באימון רשתות עמוקות, בעיקר במצבים ממדיים גבוהים ומצבי רעש סטוכסטי., תוצאות הקונברגנציה המפורשות מאפשרות למהנדסי למידה עמוקה לבחור פרמטרים (כגון קצב למידה, משקל התחלה של מאגרים ורמות דה-קומפוזיציה) באופן מושכל יותר, בהתבסס על גודל הבעיה d ועל תקציב האיטרציות T., ניתוח התלות ב־d ו־σ_s מסייע להעריך מתי שימוש בשרטוט אדפטיבי כמו RMSProp עדיף על SGD או AdaGrad, ובכך משפיע על בחירת אופטימייזר בפרויקטים מעשיים כמו אימון מודלים שפה גדולים או רשתות קונבולוציה רחבות., העבודה מדגישה גם את החשיבות למדידת נורמות שונות של הגרדיאנט (`1 מול `2), ומספקת תובנות פרקטיות לגבי מצבים בהם מדד `1 מייצג טוב יותר התנהגות בממדים גבוהים.

Huan Li ואח'
קרא עוד ←
שיטת הביטוי הסופי לפתרון משוואות דיפרנציאליות חלקיות בממדים גבוהים
Journal of Machine Learning Research
למידת חיזוק

שיטת הביטוי הסופי לפתרון משוואות דיפרנציאליות חלקיות בממדים גבוהים

31 ביולי 2025

השיטה מציעה כלי לייצור פתרונות אנליטיים או סמבוליים מקורבים ל-PDE בממדים גבוהים, דבר שיכול לסייע למהנדסים ולאנליסטים לקבל נוסחאות סגורות במקום פלטים 'שחורים' של רשתות עצביות, ובכך להקל על פרשנות, אופטימיזציה ויישום במערכות חישוביות בזמן ריצה נמוך., במקרים שבהם פתרון אנליטי משמעותי לניהול סיכונים, תכנון מחזור או ביצוע חישובי פוסט-פרוססינג (למשל במכניקה זורמת, חימצון, או מכניקת הקוונטים), FEX יכול לייצר ביטויים קלים לאחסון ולחישוב שמחליפים רשתות גדולות ומזערים עלויות חישוביות., הכלי שימושי גם כשלב חקר מודלים: באמצעות התוצאות המפורשות של FEX ניתן לעצב אדריכלות רשת מיוחדת (FEX-NN) או אלגוריתמי מיטוב שעושות שימוש במבנה הגילוי כדי לשפר מהירות התכנות והדיוק של שיטות למידה עמוקה קיימות., חוקרים בתחומי חישוב מדעי, הנדסה וגרפים סימבוליים יכולים לאמץ את הרעיון כדי לשלב חיפוש סמבולי מונחה חיזוק במטלות של גליונות PDE, אופטימיזציה של פרמטרים, וזיהוי חוקים פיזיים מדאטה.

Senwei Liang ו-Haizhao Yang
קרא עוד ←
צוואר בקבוק המידע הרב־משתני הווריאציוני העמוק - מסגרת לפונקציות הפסד וריאציוניות
Journal of Machine Learning Research
למידה עמוקה

צוואר בקבוק המידע הרב־משתני הווריאציוני העמוק - מסגרת לפונקציות הפסד וריאציוניות

31 ביולי 2025

המסגרת שימושית למחקר ופיתוח של מערכות למידה למולטי-מודאליות שבהן רוצים ללמוד ייצוגים משותפים ונפרדים (לדוגמה: תמונה-טקסט, ניתוח מולטי-אומיקס, נוירו-מידע מול התנהגות)., מפתחים יכולים להשתמש ב-DVMIB כדי לגזור פונקציות הפסד מותאמות לבעיה שלהם, לבחור מדדי מידע (InfoNCE, MINE, SMILE) ולהתאים את מסחר ה-β בין כיווץ לשחזור., ה-DVSIB והגרסאות הפרטיות (private) מאפשרות לבנות מרחבים לטנטיים שמפרידים מידע משותף לשתי תצפיות ומידע פרטי לכל תצפית — שימושי לרפואה, ביולוגיה חישובית ויישומי ראייה ממוחשבת שבהם יש רעשים ותכנים ספציפיים למדיום., הקשרים למתודות self-supervised כמו Barlow Twins ו-CLIP מסייעים להבין כיצד להמיר הפסדי קונטרסטיביים לגבולות מבוססי-מידע ובכך לשלב יתרונות של שיטות ואריאציונליות ותובנות פרקטיות של SSL.

Eslam Abdelaleem ואח'
קרא עוד ←
skglm: שיפור scikit-learn עבור מודלים ליניאריים מוכללים עם רגולריזציה
Journal of Machine Learning Research
למידה חישובית

skglm: שיפור scikit-learn עבור מודלים ליניאריים מוכללים עם רגולריזציה

31 ביולי 2025

skglm מאפשר למהנדסי נתונים ומדעני למידה חישובית להחליף בצורה חלקה את המעמדיים הרגילים של scikit-learn כאשר רוצים להתאים מודלים ליניאריים רגולריים מתקדמים: שימוש בפענוח Lasso, מסגרות קבוצתיות, penalties לא קונבקסיות (כגון MCP/SCAD) או נתוני Cox לניתוח הישרדות נעשה פשוט באמצעות אותו ממשק., הפתרון שימושי במיוחד כאשר מספר התכונות גדול ממספר הדוגמאות: האלגוריתמים של skglm מנצלים ספרסיות באמצעות working set ובכך מורידים את העלות החישובית, מה שמאפשר הרצה מהירה יותר בלפטופים או בסביבת מחשוב מוגבלת. בנוסף, היותה כתובה ב-Python ושילובה ב-scikit-learn מקל על אינטגרציה לצינורות עבודה קיימים ולטסטים אוטומטיים בארגונים.

Badr Moufad ואח'
קרא עוד ←
מרחקי וסרשטיין מותנים עם יישומים בהתאמת זרימה בייסיאנית ב־OT (הובלה מיטבית)
Journal of Machine Learning Research
למידה עמוקה

מרחקי וסרשטיין מותנים עם יישומים בהתאמת זרימה בייסיאנית ב־OT (הובלה מיטבית)

31 ביולי 2025

המאמר מספק כלי למדידה ואימון של מודלים גנרטיביים מותנים (conditional) כך שהאימון על ההתפלגות המשותפת יביא לשליטה מדויקת יותר על הפוסטריור המותנה ב-Y — שימושי בזיהוי רפואי בתנאי מדידה, בהפחתת חוסר ודאות בפתרונות אינברסיים ובשחזור תמונות מותנה בקטגוריות., השיטה המוצעת מאפשרת אימון של Velocity fields ל-Flow Matching כך שהתנועה לא תשנה את המצב התצפיתי Y, מה שמוביל לדגימה מבוקרת יותר של הפוסטריורים; זה שימושי בסימולציות פוסטריוריות גדולות וב-SBI (simulation-based inference)., הריכוך באמצעות פרמטר β נותן מסלול פרקטי ליישום עם מדגמים אמפיריים ושימוש במימושי Sinkhorn/OT למיניבצ'ים, ולכן מתאים לפיתוחים מעשיים של דגמי Conditional GANs או conditional flows במערכות עם נתונים רב-מחלקתיים.

Jannis Chemseddine ואח'
קרא עוד ←
פירוק טנזורים קרטזיים בלתי פריקים בעלי דרגה גבוהה ובסיסים של מרחבים שקולים
Journal of Machine Learning Research
למידה עמוקה

פירוק טנזורים קרטזיים בלתי פריקים בעלי דרגה גבוהה ובסיסים של מרחבים שקולים

31 ביולי 2025

המחקר מספק כלים מתמטיים ואלגוריתמיים ליצירה של שכבות לינאריות אקוויארנטיות עבור רשתות ניורוניות גרפיות ואחרות שעובדות על תכונות טנזוריאליות (כמו מולקולות/אטומים/גופים תלת־ממדיים). משמעות הדבר בפועל: אפשר לתכנן שכבות יעילות שמכבדות סימטריית סיבוב והשתקפות (O(3)) גם עבור טנזורים מדרגות גבוהות, לבצע חישובים מהירים יותר במודלים פיזיקליים וכימיים, ולבנות עיצובים נרחבים של EGNNs עם פחות פרמטרים מיותרים ויציבות נומרית טובה יותר. זה שימושי לאימון מודלים לחיזוי אנרגיות, כוחות, ספקטרוסקופיה, ותפעול רובוטי שבו נדרשת אקוויארנטיות ביחס לסיבובים.

Shihao Shao ואח'
קרא עוד ←
הבטחות ביצועים מונעות נתונים עבור אופטימיזטורים קלאסיים ונלמדים
Journal of Machine Learning Research
למידה חישובית

הבטחות ביצועים מונעות נתונים עבור אופטימיזטורים קלאסיים ונלמדים

31 ביולי 2025

המסגרת מספקת דרך מעשית לקבל ערובות ביצועים (אחוז הצלחה, קוואנטילים של שגיאה) עבור אלגוריתמים שמשתמשים בהם בעיתות ריצה קצובות: הן עבור אלגוריתמי אופטימיזציה קלאסיים והן עבור מקדמים שנלמדו. בפועל, המשמעות היא שאם אתם מפתחים מערכת המפתרת בעיות אופטימיזציה פרמטריות (למשל שיקום תמונות, סינון מדינות, מטא-לרנינג), ניתן לכמת בקלות את ההסתברות שהפתרון אחרי k איטרציות יעמוד בסף איכות נתון, ולהשתמש בכך לתכנון זמן ריצה, החלטות בטיחותיות וחילופי-טריידאופים בין מהירות לדיוק. עבור מקדמים נלמדים, המחקר מציע גם שיטת אימון שמייעדת ישירות לפישוט הגבול התיאורטי (PAC-Bayes), כך שהתוצאות המותאמות-נתונים מוכיחות שיפור אמיתי ביכולת הכלליזציה תחת תקציב איטרציות.

Rajiv Sambharya ו-Bartolomeo Stellato
קרא עוד ←
בחירה אופטימלית של דגימות באמצעות הערכת אי-ודאות ויישומה בלמידה עמוקה
Journal of Machine Learning Research
למידה עמוקה

בחירה אופטימלית של דגימות באמצעות הערכת אי-ודאות ויישומה בלמידה עמוקה

31 ביולי 2025

העיקרון המרכזי מאפשר למפתחים לחסוך בעלויות תגיות וחישוב על ידי בחירת תת-מדגם אינפורמטיבי ככל האפשר מתוך מאגר נתונים גדול, כך שניתן לאמן רשת עמוקה קרובה בביצועיה לרשת שאומנה על כל המידע., ביישומי Active Learning הוא מספק מדד דגימה לא-מונוטוני שמתאים גם למצבים שבהם אין תוויות זמינות מראש: בוחרים דוגמאות עם אי־ודאות גדולה יחסית (מוערכת על ידי שונות לוגיטים) כדי לבקש תיוג אנושי חכם יותר., בשירותי תיוג וסביבות תעשייתיות מאפשר לצמצם את מספר הדוגמאות שיש לתייג על ידי בחירת תתי-קבוצות שעושות את המרב לשיפור דיוק המודל, ובכך לחסוך משאבי עבודה וכוח מחשוב., ביישומי למידה תחת רעש תוויות (label noise) ומודלים שאינם מתאימים לחלוטין לנתונים, השינוי המוצע (הגבלת אי־הודאות) מפחית רגישות לדוגמאות נדירות ורועשות ומייצר הערכות יציבות יותר., אפשר להשתמש בשיטה גם לצורך בניית 'coreset' יעיל לאימון חוזר של מודלים בזמן אמת או ביישומים בעלי מגבלות חישוביות (מובייל, edge) שבהם אי-אפשר לאחסן או לעבד את כל הנתונים.

Yong Lin ואח'
קרא עוד ←
שודדים קונטקסטואליים עם אילוצים שלביים
Journal of Machine Learning Research
למידה חישובית

שודדים קונטקסטואליים עם אילוצים שלביים

31 ביולי 2025

המחקר מספק כלים אלגוריתמיים ותאורטיים להרצה בטוחה של מערכות המלצה, ניסויים קליניים, ושליטה אוטונומית שבהן לכל פעולה יש לא רק תגמול אלא גם 'עלות' שיש לשמור מתחת לסף בכל שלב. כלומר, אם מערכת צריכה להמליץ פריטים, לשלוח התראות, או לבחור טיפולים רפואיים — היא לא תוכל לבחור פעולה שמגבירה רווח מיידי אך עלולה לפגוע במדד בטיחות או שביעות רצון. האלגוריתמים המוצעים מאפשרים לשלב חקירה (להבין אילו פעולות טובות) יחד עם הגבלת העלות בכל סיבוב, ובכך להפעיל מערכות אונליין עם ערבויות ביצועים ובטיחות ריאליסטיות. עבור מהנדסי AI המשמעותית היא שסכמות אלה מאפשרות איזון בין שיפור ביצועים לבין שמירה על מגבלות אופרטיביות בכל רגע.

Aldo Pacchiano ואח'
קרא עוד ←
בתוך הכלוב הבלתי נראה: כיצד אלגוריתמים שולטים בעובדים
Administrative Science Quarterly (book review)
השפעות חברתיות-כלכליות ומקרו של AI

בתוך הכלוב הבלתי נראה: כיצד אלגוריתמים שולטים בעובדים

30 ביולי 2025

למנהלים ובעלי עסקים: המחקר מדגיש שיישום מערכות אלגוריתמיות לניהול עובדים (לוח זמנים אוטומטי, דירוג ביצועים, ניטור פעילות) יכול לשפר מדדים תפעוליים אך גם לפגוע במוטיבציה, נאמנות ואוטונומיה של עובדים. ההמלצות המעשיות כוללות הגדלת שקיפות של מערכות ההערכה, מתן ערוצי משוב לעובדים, בדיקות הוגנות לפני הטמעה, ושילוב שיקולים אתיים/רגולטוריים בתכנון כלי ניהול מבוססי נתונים. מנהלים צריכים לאזן בין יעילות למדיניות שמירה על הון אנושי ועמידות ארגונית.

Matt Beane
קרא עוד ←
אלגוריתמים אופטימליים ויעילים עבור אופטימיזציה קמורה מקוונת מבוזרת
Journal of Machine Learning Research
למידה חישובית

אלגוריתמים אופטימליים ויעילים עבור אופטימיזציה קמורה מקוונת מבוזרת

24 ביולי 2025

העבודה שימושית במערכות מבוזרות שבהן מספר סוכנים מקבלים הפסדי אונליין מקומיים ורוצים למזער הפסד גלובלי בלי לשתף מידע מלא — למשל רשתות חיישנים לעקיבה, מערכות ניתוב חבילות, או למידת מודלים תמחיריים מבוזרים עם תקשורת מוגבלת., האלגוריתם המוצע מאפשר הפחתת תקשורת וביצועי קריאה/חישוב טובים יותר לעומת שיטות קיימות, וכך מתאים למערכות עם עלות תקשורת גבוהה או מגבלות סוללה, כאשר נדרש שבוץ בזמן אמת (online) ושיפור מהיר בסכום האיבוד., הגרסה projection-free מתאימה לבעיות עם מגבלות מורכבות (כמו מגבלות נוסחות מטרציות או נוקשות טופולוגית) שבהן הפרויקטאות (projections) יקרות, ומאפשרת החלפה בפתרון לינארי יעיל יותר תוך שליטה במספר סבבי התקשורת הנדרש.

Yuanyu Wan ואח'
קרא עוד ←
מכונת וקטורים תומכים (SVM) דלילה עם פונקציית הפסד של שוליים קשיחים (Hard-Margin): שיטת ניוטון ללגרנז' מועשר בממדים מוקטנים
Journal of Machine Learning Research
למידה חישובית

מכונת וקטורים תומכים (SVM) דלילה עם פונקציית הפסד של שוליים קשיחים (Hard-Margin): שיטת ניוטון ללגרנז' מועשר בממדים מוקטנים

24 ביולי 2025

האלגוריתם מאפשר לאנליסטים ולמהנדסי למידה מכונה לאמן מסווגים ליניאריים חזקים שמחזיקים במספר קטן של תכונות (feature selection) תוך אופטימיזציה של מספר השגיאות הקלאסיות (0/1 hard-margin). זה רלוונטי במצבים שבהם נדרשת פרשנות ופרוטקציה על תכונות, למשל במודלים רפואיים או פיננסיים., ביישום מעשי, הגישה עוזרת להקטין את עלות האחסון והחישוב בזמן אימון ובשימוש בזמן ריצה על ידי צמצום מספר התכונות והווקטורי תמיכה (support vectors), דבר חשוב במערכות עם משאבים מוגבלים ובמקרים בהם יש צורך בסבר-לחיצות על המודל., המתודולוגיה מספקת מסגרת כללית לפתירת בעיות קומבינטוריות לא-חלקיות דומות (שילוב `ℓ0` ואובדנים דמויי 0/1) ולכן יכולה לשמש כבסיס לפיתוח אלגוריתמים אחרים בשילוב מציאת תתי-מרחבים וניוטון להאצה.

Penghe Zhang ואח'
קרא עוד ←
רגרסיה לא פרמטרית על גרפים גאומטריים אקראיים שנדגמו מתת־יריעות (Submanifolds)
Journal of Machine Learning Research
למידה חישובית

רגרסיה לא פרמטרית על גרפים גאומטריים אקראיים שנדגמו מתת־יריעות (Submanifolds)

24 ביולי 2025

העבודה מבהירה כיצד להשתמש ביצוגים ספקטרליים של גרף מבוסס-נקודות כדי לבצע רגרסיה לא-פאראמטרית כאשר הנתונים חיים על תת-מרחב נמוך־ממד (manifold). בפועל זה אומר: אם יש לכם נתונים גבוהי־ממד שנראים כאילו הם על פני משטח (לדוגמה נתוני תמונה, מדידות ביולוגיות, תכונות חישה), ניתן לבנות גרף שכונס לפי מרחקים, לחשב את eigenvectors של לאפלסיָן הגרף ולהשתמש בהם כבסיס לבניית פרייר או לאמידה רגילה — כך מקבלים הערכות שמותאמות באופן ממצה למורשת המניפולדית ולא לממד החיצוני. בנוסף, שימוש בפרייר אדפטיבי על מספר הבסיסים וקשרי הגרף מאפשר התאמה אוטומטית לחלקות הלא־ידועה של הפונקציה, כלומר פחות כוונון ידני ועמידות טובה יותר לנתונים לא־מתויגים.

Paul Rosa ו-Judith Rousseau
קרא עוד ←
התכנסות האיטרציה האחרונה של שיטת הגרדיאנט עם מומנטום וערבול (סדר-נתונים) תחת אי-השוויון של קורדיקה-לויאשביץ'
Journal of Machine Learning Research
למידה חישובית

התכנסות האיטרציה האחרונה של שיטת הגרדיאנט עם מומנטום וערבול (סדר-נתונים) תחת אי-השוויון של קורדיקה-לויאשביץ'

24 ביולי 2025

המאמר מספק בסיס תיאורטי חשוב למפתחים ומהנדסי למידה חישובית שמשתמשים באלגוריתמים מבוססי shuffling (למשל Random Reshuffling) עם מומנטום לאימון רשתות נוירונים: התוצאות מראות שהפלט הנפוץ במ实践 — האיטרציה האחרונה — אכן מוביל לנקודת סטציונריות תחת תנאים ריאליסטיים., במערכות שבהן אחסון אמצעים וביצוע חישוב מלא של גרדיאנט אינו אפשרי, תובנות על קצבי התכנסות ותלות ב-n (ממד הדאטה) מסייעות לבחור פרמטרים פרקטיים כמו צעד-למידה ומומנטום כדי להשיג ביצועים טובים יותר בזמן ריצה סביר., ההוכחות ל-last-iterate ולחיזוקים תחת תנאי KL מועילות למחקר ופיתוח של וריאנטים נוספים כגון שיטות עם שיפור-שונות (variance reduction), אלגוריתמים אדפטיביים, ויישומים מבוזרים או מקביליים שבהם שמירת ממוצעים/מינימום אינה נוחה., למעבדות וחברות שמפתחות ספריות אופטימיזציה (PyTorch, TensorFlow) המסקנות מאפשרות להצדיק פרמטר ברירת מחדל שמחזיר את האיטרציה האחרונה ולא דורש ממירת פלט יקרה כמו ממוצעים או חוויית אחסון של כל האיטרציות.

Yuqing Liang ו-Dongpo Xu
קרא עוד ←
אמידת התפלגות תחת נורמת האינסוף
Journal of Machine Learning Research
למידה חישובית

אמידת התפלגות תחת נורמת האינסוף

24 ביולי 2025

המחקר מספק שיטות וגבולות ברי-חישוב להגדרת רוחב תהודה (confidence cube) סביב ההערכה האמפירית של התפלגות דיסקרטית כך שמתקיים כיסוי אחיד על כל הסמלים. מבחינה מעשית זה מאפשר למפתחים ולמהנדסי נתונים להפיק תדירותות וסימנים פופולריים מתוך דגימות (למשל שמות, מילים, קטגוריות) ולציין מרווחי ביטחון אמינים גם כאשר האלפאבית גדול או בלתי-מוגבל. היישום הקרוב ביותר הוא אינפרנציה סלקטיבית: דיווח בטוח על ה-k הפריטים השכיחים בדגימה מבלי להזדקק לתיקוני כפל בדיקות כבדים. כמו כן, הגבולות התלויי־נתונים מאפשרים חיסכון בדוגמות ובשיפור דיוק בתחומי ניתוח טקסט, מדידות בדעת הקהל, זיהום אירועים נדירים ועוד.

Aryeh Kontorovich ו-Amichai Painsky
קרא עוד ←
רנדומיזציה יכולה להפחית הן את ההטיה והן את השונות: מקרה בוחן ביערות אקראיים
Journal of Machine Learning Research
למידה חישובית

רנדומיזציה יכולה להפחית הן את ההטיה והן את השונות: מקרה בוחן ביערות אקראיים

24 ביולי 2025

המאמר מספק תובנה מעשית למה וכיצד כדאי לכוון את הפרמטר mtry ביישומי Random Forest: על בעיות שבהן קיימים דפוסים מקומיים נדירים או מוסתרים, הקטנת mtry יכולה לאפשר לאנסמבל לאתר אותם ולהפחית הטיה, ולכן מומלץ לכוון את הפרמטר ולא להסתמך על ברירת המחדל., למנתחי נתונים ומדעני ML בעסקים (כגון פיננסים, אמצעי חישה, נדל"ן) המחקר מציע להבין מתי random forest יניב שיפור על פני bagging גם כשאיכות האות גבוהה, וכיצד שילוב של רנדומיזציה בשכבות העליונות של העץ בלבד עשוי לשפר תוצאה מבלי לפגוע ביכולת הכללית., המחקר מספק כלים לבדיקת נוכחות "דפוסים מוסתרים" דרך ניתוח שגיאות אימון לפי תתי-אזורים, ותהליך להשוואת שיטות רגולציה שונות (TRIM, augmented bagging) כדי לבחור את האסטרטגיה המתאימה לפי יחס אות לרעש (SNR).

Brian Liu ו-Rahul Mazumder
קרא עוד ←
EMaP: בינה מלאכותית ניתנת להסבר באמצעות שיבושים מבוססי יריעה (Manifold)
Journal of Machine Learning Research
בינה מלאכותית מסבירה

EMaP: בינה מלאכותית ניתנת להסבר באמצעות שיבושים מבוססי יריעה (Manifold)

24 ביולי 2025

המחקר מציע דרך לשפר את השיטות המבוססות-פריטובציה (כמו LIME/SHAP) על ידי יצירת דגימות שתואמות טוב יותר למבנה הפנימי של הנתונים. משמעות הדבר בעולם המעשי: כאשר רוצים להסביר החלטות של מודל שחור (למשל סיווגים רפואיים, החלטות פיננסיות או המלצות), ניתן להפיק תוצאות אמינות יותר ע"י שימוש ב־EMaP — ההסברים יהיו פחות רעשיים, בעלי מדדי נאמנות טובים יותר ועמידים יותר לניסיונות הטעיה שבו תוקף מעוניין להסתיר החלטות מוטות. השיטה שימושית למיישמי מערכות החלטה אשר רוצים הסברים מקומיים מדויקים ובטוחים מבלי להאמין לתבניות שאינן טבעיות מבחינת נתוני האימון.

Minh Nhat Vu ואח'
קרא עוד ←
קבלת החלטות היררכית המבוססת על עקרונות מידע מבניים
Journal of Machine Learning Research
למידה עמוקה

קבלת החלטות היררכית המבוססת על עקרונות מידע מבניים

1 ביולי 2025

מחקר זה בא להציג מסגרת חדשה ללמידת מכונה, שמאפשרת למערכות חכמות ללמוד לבצע משימות מורכבות בצורה עצמאית ויעילה יותר. במקום להסתמך על הנחיות מפורטות או ידע קודם, השיטה מאפשרת למחשב לגלות בעצמו שלבים קטנים (כישורים) ותפקידים, ולשלב אותם לפתרון בעיות גדולות. המשמעות המעשית היא שרובוטים, תוכנות או מערכות אוטונומיות יוכלו ללמוד מהר יותר, להיות גמישות יותר ולהתמודד עם מצבים מורכבים כמו שיתוף פעולה בין סוכנים או ביצוע פעולות פיזיות מסובכות, מה שיכול לתרום ליישומים בתחומי רובוטיקה, תעשייה, תחבורה ועוד.

Xianghua Zeng ואח'
קרא עוד ←
על תיאוריה לא-אסימפטוטית של רשתות עצביות חוזרות (RNN) בתהליכי נקודה טמפורליים
Journal of Machine Learning Research
למידה עמוקה

על תיאוריה לא-אסימפטוטית של רשתות עצביות חוזרות (RNN) בתהליכי נקודה טמפורליים

30 ביוני 2025

העבודה מספקת מסגרת תיאורטית שמגבה שימוש ב-RNN לניתוח ולהסקת אינטנסיביות באירועים בלתי-סדירים בשעת הזמן, ולפיכך מסייעת להסביר למנהלים ומהנדסי ML מדוע מודלים אלה כל כך יעילים במאפייני אירועים כמו עסקאות פיננסיות, פעילות משתמשים, או זיהוי אירועים ביולוגיים., הגבולות הלא-אסימפטוטיים והקונסטרוקציות המפורשות מאפשרים למפתחים לבחור עומק ורוחב רשת מתאימים כדי להשיג ערכת ביצועים מובטחת בהתאם למאגר הדאטה, ולהבין את הסחר-מכר בין עלות חישובית לשגיאת הכללה., הטכניקות הפרקטיות (חיתוך אורכי רצפים, דרישות על חישוב Lipschitz, וקירובים של פונקציות התגרות) יכולות לשמש כקווים מנחים בבניית ארכיטקטורות RNN-TPP אמינות לשימוש תעשייתי וקליניות.

Zhiheng Chen ואח'
קרא עוד ←
גבולות (חסמים) ללמידה של מודלי מרקוב חבויים לא-פרמטריים
Journal of Machine Learning Research
למידה חישובית

גבולות (חסמים) ללמידה של מודלי מרקוב חבויים לא-פרמטריים

30 ביוני 2025

המאמר מספק מסגרת תיאורטית ושיעורי שגיאה מדויקים עבור מי שמפתח אלגוריתמים לאמידת HMM בלתי-פרמטריים; זה שימושי למתכנתי מערכות כריית סיגנלים או אנליטיקה סדרתית שבקצה עלולים להיתקל בנתונים כמעט בלתי תלויים., האלגוריתם המוצע (שילוב של מצבי רגעים, מציאת מטוס מפריד וגלי־וויבלט עם סף חסימה בבלוקים) ניתן ליישום מעשי ומשפיע על בחירת פרמטרי כיבוי/סף בתוכנות לאמידת צפיפויות במצבים עם תלות סמויה., התובנות על תלות הקצב בקרבה לגבול i.i.d. יכוונו פרקטיקות בדיקה ובדיקת יציבות: כשנתונים קרובים לעצמאות יש לצפות לירידה ביציבות האמידה ולדרוש יותר דגימות או אילוצים מבניים., ממצאי ה"שיתוף עוצמת האמידה" (borrowing strength) פתוחים ליישום בסביבות היברידיות שבהן אחת הקומפוננטות צפופה וחלקה — ניתן לנצל זאת בשיטות מעשיות כדי לשפר הערכות של רכיבים רעשים יותר.

Kweku Abraham ואח'
קרא עוד ←
סיווג במסגרת תערובת אנאיזוטרופית בממדיות גבוהה: גישה חדשה לאינטרפולציה רובסטית
Journal of Machine Learning Research
למידה חישובית

סיווג במסגרת תערובת אנאיזוטרופית בממדיות גבוהה: גישה חדשה לאינטרפולציה רובסטית

30 ביוני 2025

המאמר מספק כלים להבנה מתי ניתן להשתמש במודלים יתר-מולכדים (interpolating) בבניית מקטלגים ליניאריים במימד גבוה ואיך לבחור בין רגולריזציה לשיטת fit מלאת-נתונים במציאות שבה השגיאה אינה איזוטרופית., מסקנותיו פרקטיות למפתחי אלגוריתמים: במצבים בהם רעש התצפיות מצוי בספקטרום אנאיזוטרופי עם מספר מצומצם של כיוונים "חזקים", פתרונות אינטרפולציה עלולים להוביל לביצוע מינימקסי ולעיתים עמידות לזיהום אימונים—תובנה חשובה בבחירת שיטות למידת-מכונה במערכי נתונים גדולים ומרובי מאפיינים., התנאים המשופרים לשכפול וקטורי תמיכה (SVP) ותובנות לגבי מתי SVM ו-OLS מתאחדים מסייעים בקביעת תקציבי ממדים ודאטה לניהול מאמץ חישובי והערכת יכולת הכללה של מודלים.

Stanislav Minsker ואח'
קרא עוד ←
אפיון היציבות הדינמית של ירידה סטוכסטית בגרדיאנט בלמידה עודפת-פרמטרים
Journal of Machine Learning Research
למידה חישובית

אפיון היציבות הדינמית של ירידה סטוכסטית בגרדיאנט בלמידה עודפת-פרמטרים

30 ביוני 2025

המאמר מספק מסגרת תיאורטית להבנת אילו פתרונות אופטימליים אלגוריתמי אימון (GD/SGD) ימצאו בפועל ברשתות עמוסות-פרמטרים; זו תובנה חשובה כשמנסים להסביר מדוע רשתות גדולות הכלליותטטיה בפועל., כלי ה-λ כמדד יציבות ל-SGD מאפשר ניתוח והשוואת פרמטרים אימון: בחירת שיעור למידה, מידת המיני-בצ' ותכנוני אופטימיזציה עלולה לשנות את סימנו של λ ולפיכך להשפיע על היעד אליו האלגוריתם יוביל., ההיגדים מתורגמים למדדים ניתנים למדידה ניסויית (למשל חישוב λ לאורך מסלול האימון או בדיקת ספקטרום ה-Hessian של ה-loss), ולכן מאפשרים לחוקרים ומהנדסים לזהות שלבים כמו "edge of stability" ולבחון השפעות על generalization., ניתן להרחיב את התובנות לכל מיני וריאציות פרקטיות: מיני-בצ' גדול, רשתות רב-ממדיות, ולחלק מהאופטימייזרים (עם זהירות לגבי תנאי ליניאריזציה).

Dennis Chemnitz ו-Maximilian Engel
קרא עוד ←
אמידת צפיפות באמצעות הפרספטון (Perceptron)
Journal of Machine Learning Research
בינה מלאכותית גנרטיבית

אמידת צפיפות באמצעות הפרספטון (Perceptron)

30 ביוני 2025

המחקר מספק דרך מעשית ותיאורטית לאמן דגמי-גנרטור (כמו GANs או דגמי דיפוזיה) בעזרת מדדי השוואה פשוטים וחישוביים: במקום להסתמך על דיסקרימינטורים עשירים וגדולים, ניתן להתאמץ על מדד אנרגיה E_γ (או ממוצע הפרספטון) המחושב ישירות מהדגימות הנצפות והדגימות המופקות מהגנרטור. שיטה זו ניתנת ליישום על ידי דגימה מהגנרטור וחישוב איבודים E_γ וגרדיאנטים שלהם (עלות חישובית O(n^2+m^2)), ואז עדכון פרמטרי הגנרטור ב-SGD. עבור נתונים קטגוריאליים המחקר מציע לקודד קטגוריות כוקטורי קוד מתקנים (ECC) בממד d≈log(k) כדי לאפשר הערכת TV אפקטיבית באמצעות תכונות לינאריות פשוטות. בתרגום מעשי — מפתחים יכולים להשתמש במדד האנרגיה כאובייקט אימון פשוט, יציב ומניח תיקים הסטטיסטיים טובים על אוכלוסיות חלקות או תערובות גאוס, ולקבל ביצועים קרובים לאופטימליים מבחינת דגימתיות.

Patrik Robert Gerber ואח'
קרא עוד ←
PREMAP: מסגרת מאחדת לקירוב קדם-דמות (Preimage) לרשתות עצביות
Journal of Machine Learning Research
למידה עמוקה

PREMAP: מסגרת מאחדת לקירוב קדם-דמות (Preimage) לרשתות עצביות

30 ביוני 2025

PREMAP מאפשר למהנדסי בקרה ומפתחים של מערכות עם רכיבי החלטה מבוססי רשתות עצביות לזהות באופן סימבולי את קבוצת הקלטים שמובילים לתוצאה רצויה או בלתי רצויה, מה שמועיל לניתוח מערכות אוטונומיות, נהיגה אוטונומית ובקרת מטוסים., בבדיקות חוסן ואבטחת מערכות, ניתן להשתמש ב-PREMAP כדי להפיק תחת-קירובים שמספקים ערכת קלטים בטוחה לתכונה נתונה, ולאמת תכונות כמותיות כגון 'לפחות p אחוזים מהקלטים מביאים לפעולה מסוימת'., המסגרת מתאימה למשימות ראייה במימדים גבוהים (למשל MNIST) הודות לשילוב פיצול ReLU וייעול פרמטרי ההרפיה, ומספקת דו"חות פוליהדרליים שניתן לשלב בשרשרות אימות ובהסבר החלטות., חוקרי פורמליות יכולים להשתמש ב-PREMAP כבסיס לשיטות hybrid שמשלבות קשיחות פורמלית עם שיטות הסתמנותיות למטרות הערכה כמותית וניתוח מרחבי הקלט.

Xiyue Zhang ואח'
קרא עוד ←
גיוון עצבי מערכתי: מדידת הטרוגניות התנהגותית בלמידה מרובת־סוכנים
Journal of Machine Learning Research
מערכות מרובות-סוכנים ובינה קולקטיבית

גיוון עצבי מערכתי: מדידת הטרוגניות התנהגותית בלמידה מרובת־סוכנים

30 ביוני 2025

מחקר זה מספק כלי כמותי למדידת והגדרה של 'גיוון התנהגותי' בין סוכנים שלמדו מדיניות עצמאית. משמעותי לפרקטיקה: ניתן לזהות מתי כדאי להשתמש באימון הומוגני (שתף פרמטרים) כדי לחסוך מדגמי אימון, ומתי יש ערך בהשארת מדיניות הטרוגנית כדי להשיג חסינות לתקלות או הפרעות. בנוסף, באמצעות שליטה ב-SND ניתן לכוון רמות גיוון רצויות (למשל להחיל גבול תחתון/עליון), ובכך לשפר את שלב החיפוש של המדיניות ולזרז התכנסות. יישומים מעשיים: תכנון קונטרולים וטקטיקות בצוותי רובוטים, מערכות רב־רכיביות בתעשייה, שיתופי פעולה של כלי רכב אוטונומיים, ורובוטיקה שיתופית שבה דרוש איזון בין מומחיות (התמחות) לבין רזרבה/גיבוי.

Matteo Bettini ואח'
קרא עוד ←
מודלים לתהליכים לטנטיים (סמויים) עבור נתוני רשת פונקציונליים
Journal of Machine Learning Research
למידה חישובית

מודלים לתהליכים לטנטיים (סמויים) עבור נתוני רשת פונקציונליים

30 ביוני 2025

המתודולוגיה מאפשרת לאנליסטים ולחוקרים לאמוד ולחזות מבנה ממוצע של רשת המשתנה בזמן (או עוד משתנה רציף) בצורה חלקה ומדורה, שימושי לניתוח קשרים בין מדינות, ניתוח תקשורת חברתית לאורך זמן, ורשתות ביולוגיות תחת מדדים רציפים., כיוון שהשיטה משתפת מידע מקומי בין snapshots דרך מרחב בסיס פונקציונלי, היא מתאימה במיוחד כאשר יש מעט דגימות בכל snapshot אך צפויה חלקות בפעילות הלטנטית בזמן; מתאים לאינטרפולציה של snapshot-ים חסרים ולניקוי רעשים., האלגוריתם ממומש ומקל על חישוב שפה של embedding פונקציונלי (FASE) שמאפשר ויזואליזציה אינטראקטיבית של וקטורי צמתים המשתנים ברצף, דבר שמסייע בזיהוי שינויים דינמיים, מציאת שינויים פתאומיים והשוואות בין תקופות.

Peter W. MacDonald ואח'
קרא עוד ←
למידה בייסיאנית דינמית עבור מודלים מכניסטיים (מנגנוניים) מרחביים-זמניים
Journal of Machine Learning Research
למידה חישובית

למידה בייסיאנית דינמית עבור מודלים מכניסטיים (מנגנוניים) מרחביים-זמניים

30 ביוני 2025

המאמר מספק כלי פרקטי לחוקרים ומהנדסים שרוצים לאמן אמולטורים סטטיסטיים למודלים מכניסטיים יקרים לחישוב, כלומר להחליף ריצות סימולטור כבדות על ידי חיזוי יעיל של פלטים בקלטים חדשים תוך כימות אי‑וודאות., המסגרת מאפשרת שילוב מערכי נתוני שדה עם פלטי סימולטורים בצורה מודולרית לצורך קליברציה או מיזוג מידע, שימושי במדעי האקלים, אקולוגיה, מדעי הבריאות ומודלים של התפשטות מחלות., ההיצע של Bayesian transfer learning מאפשר להתמודד עם שדות מרחביות-זמניים גדולים על מחשוב סביר על ידי חלוקת הבעיה לאפיזודות והתאמת FFBS מקומי, מה שמאפשר פריסת שיטות על נתוני רזולוציה גבוהה., מתודולוגיה זו מתאימה גם לכיול דגמי רשתיים (network diffusion) וסימולטורים מבוססי-סוכנים שבהם הפלט הוא סדרת מצבים מרחביים לאורך זמן, ומקלה על הערכת פרמטרים ותכנון ניסויים.

Sudipto Banerjee ואח'
קרא עוד ←
רגרסיית סקלר-על-תמונה בייסיאנית עם פריור (קדימות) משתנה מרחבית של רשת עצבית חד־שכבתית
Journal of Machine Learning Research
למידה עמוקה

רגרסיית סקלר-על-תמונה בייסיאנית עם פריור (קדימות) משתנה מרחבית של רשת עצבית חד־שכבתית

30 ביוני 2025

השיטה נותנת כלי פרשני לחוקרים ובעיקר למשתמשים בתחום רפואת המוח כדי לזהות אזורים במיפוי תמונתי (fmri, CT, MRI) שמסבירים שינוי במשתנה סקלרי כמו ציון קוגניטיבי או מדד קליני, במקום להסתמך על DNN חסרי פרשנות., המודל מועיל במצבי "נתונים מעטים" שנפוצים ברפואה ובמדעי החיים: על ידי הצמדה של prior מרחבי חלק וספארסי ניתן להשיג ניבוי טוב יותר ויציב יותר מאשר רשתות עמוקות קלאסיות עם אותן דוגמות אימון., הגישה מתאימה גם לאפליקציות בתחום ראייה ממוחשבת שבהן יש חשיבות לזיהוי אזורים מקומיים בעלי משמעות, לדוגמה זיהוי תכונות מקומיות בתצלומי תעשייה או סנסורים, כשנדרש גם כימות אי-וודאות לבחירת התכונות., האלגוריתם המוצע מבוסס SGLD מאפשר סקיילינג לנתונים גדולים יחסית ומאפשר שילוב בין גישות גרדיאנטיות יעילות לבין גישה בייסיאנית שמספקת מדדי אי-וודאות (כגון PIP) לבחירת משתני תמונה.

Ben Wu ואח'
קרא עוד ←
כימות היעילות של קדם־התניה ליניארית במונטה־קרלו בשרשראות מרקוב
Journal of Machine Learning Research
למידה חישובית

כימות היעילות של קדם־התניה ליניארית במונטה־קרלו בשרשראות מרקוב

30 ביוני 2025

הממצאים מספקים הנחיות להנדסה פרקטית של מנסים ב-MCMC: כאשר אפשר, להעריך ולהשתמש במטריצת הקווריאנס של היעד כפרה-קונדיffיונר (L = Σπ^{-1/2}) או להשתמש בהרכבים מבוססי נתונים (QR או (Z^T Z)^{1/2}) כדי להקטין את מספר התנאים ולשפר את ערבוב השרשרת., התוצאות מזהירות מפני שימוש אוטומטי בפרה-קונדיffיונינג אלכסוני פשוט (diag(cov)) שכן במקרים עם קורלציות חזקות הוא עלול להגדיל את מספר התנאים ולהדרדר את ביצועי הממשל המקרופוני; לכן מומלץ להשוות ביצועים לפני יישום אוטומטי., למפתחי HMC והמעשיים במודלים גבוהי-ממדים המסמך מציע דרך לכמת את החיסכון בחישוב: פרה-קונדיffיונינג נכון יכול להקטין משמעותית את מספר צעדיו של הליפרוג (leapfrog), בקירוב בסדר גודל של √κ, וכך להפחית עלויות חישוביות לכל דגימה עצמאית., חוקרים שצריכים לתכנן אלגוריתמים מבודדים ימצאו במאמר גבולות תיאורטיים וכלים להערכת היעילות של בחירות פרה-קונדיffיונר שונות (Fisher, Hessian at mode, QR, וכו') תחת מבנים סטנדרטיים של מודלים.

Max Hird ו-Samuel Livingstone
קרא עוד ←
אומדן ליניארי חסר הטיה הטוב ביותר מתוך טבלאות מותאמות פרטיות
Journal of Machine Learning Research
אבטחת מידע ופרטיות ב-AI

אומדן ליניארי חסר הטיה הטוב ביותר מתוך טבלאות מותאמות פרטיות

30 ביוני 2025

המחקר מספק כלי פרקטי לעיבוד והצגת ספירות דמוגרפיות או סטטיסטיות שמוגנות בדיפרנציאל פריבסי, לדוגמה נתוני מפקד אוכלוסין. במקום לפרסם ישירות ספירות רעשיות הלא-קוהרנטיות בין מרג'ינים שונים, SEA BLUE מייצר הערכות לינאריות בלתי-מוטות המייצרות עקביות פנימית (self-consistency), מפחיתות שגיאה ומשמרות את ההגנה הפרטית המקורית (post-processing חסין). המשמעות היא שמשרדי סטטיסטיקה, חוקרים ואנליסטים יכולים לקבל הערכות מדויקות יותר עם אומדני שגיאה וטווחי אמון שניתן לחשב במהירות ובזיכרון נמוך יחסית, מה שמקל על שימוש בנתוני DP בקבלת החלטות, ניתוחי מדיניות, ומחקרים חברתיים-דמוגרפיים.

Jordan Awan ואח'
קרא עוד ←
הסקה פוסטריורית (אחורית) ווריאציונית עבור רשתות עצביות עמוקות עם משקלים בעלי זנב כבד
Journal of Machine Learning Research
למידה עמוקה

הסקה פוסטריורית (אחורית) ווריאציונית עבור רשתות עצביות עמוקות עם משקלים בעלי זנב כבד

30 ביוני 2025

העבודה מספקת מסגרת פרקטית לבניית priors עבור Bayesian Neural Networks שבו אין צורך במדגם של היפר-פרמטרים של הארכיטקטורה; זה מקל על מימוש MCMC ו-Variational Bayes באפליקציות שבהן רוצים כימות אי-ודאות אמין מבלי לבצע חיפוש תצורה יקר., הקירובים הווריאציוניים mean-field המוצעים דורשים רק פרמטרי מיקום וסקלתיות לכל משקל ולכן מתאימים ליישום בקנה מידה גדול כאשר דרוש סחר-חומרה בין ביצועים סטטיסטיים ליעילות חישובית., השיטה שימושית במטלות רגרסיה לא פרמטריות, בעיבוד נתונים על מניפולדות או מבנים גיאומטריים וכאשר החלקות של הפונקציה אינה ידועה מראש; היא מאפשרת התאמה אוטומטית לחלקות ולאינטנסיביות ממד פנימית כדי להשיג קצבים קרובים לאופטימליים., בניסויים והכרות תפעולית, ניתן לשלב את ה-prior הכבד-זנב עם טכניקות אימון קיימות ולבחון שימוש ב-HMC או ב-VB לשילוב בין איכות חיזוי לבין עלות חישובית והערכת אי-ודאות.

Ismaël Castillo ו-Paul Egels
קרא עוד ←
שיטות ממוצעות של מרחקי k-ממוצעים מסודרים לזיהוי חריגות
Journal of Machine Learning Research
למידה חישובית

שיטות ממוצעות של מרחקי k-ממוצעים מסודרים לזיהוי חריגות

30 ביוני 2025

המחקר מספק שיטה פרקטית לזיהוי אנומליות (outliers) בנתונים ללא תיוג (unsupervised). המודל מתאים במיוחד למנהלי מוצר/טכנולוגיה בארגונים שמחפשים פתרון יציב, לא רגיש לפרמטרים (כגון k), ויעיל חישובית כדי לגשת לערכות נתונים גדולות. BRDAD מאפשר דירוג דגימות לפי סיכוי לאנומליות בלי צורך בהתאמה ידנית מרובה של היפר‑פרמטרים, ובכך מפחית הזמן הדרוש לפריסה ולכיוון המערכת. עבור יישומים כמו גילויים של הונאות פיננסיות, ניתוח רשתות, ניטור תפעולי ותקלות תעשייתיות — השיטה מציעה איזון בין דיוק תיאורטי לבין ביצועים אמפיריים ויעילות חישובית.

Yuchao Cai ואח'
קרא עוד ←
אלגוריתם מהיר לבעיות היפוך ליניאריות מאולצות
Journal of Machine Learning Research
למידה חישובית

אלגוריתם מהיר לבעיות היפוך ליניאריות מאולצות

24 ביוני 2025

המחקר מפתח אלגוריתם מהיר ויעיל לפתרון בעיות שיקום אותות ותמונות הנוסחות כאופטימיזציה קמורה עם אילוץ מרחב כדורי (למשל התאמת תמונה מרעש, compressed sensing ושחזור אותות דלילים). שימוש מעשי: מהיר יותר בשחזור תמונות ומימושים של דחיסה ודנואיזינג; יכול להחליף או להאיץ שיטות פרימל-דואליות ו-ADMM במערכות עיבוד תמונה, במערכי חיישנים וביישומי סיגנל/בקרה שבהם האילוץ הוא חסן רעש (ball constraint). יתרון מהותי הוא ירידה משמעותית במספר האיטרציות ובזמן החישוב לעומת CP ו-C-SALSA וכן חסכון בחישובי SVD חוזרים במקרים מסוימים.

Mohammed Rayyan Sheriff ואח'
קרא עוד ←
למידת שחקן–מבקר לבקרת שדה ממוצע בזמן רציף
Journal of Machine Learning Research
למידת חיזוק

למידת שחקן–מבקר לבקרת שדה ממוצע בזמן רציף

24 ביוני 2025

המאמר מספק שיטה מעשית ללימוד מדיניות אופטימלית במערכות עם אינטראקציה בין-סוכנית שבהן לא ידוע המודל, לדוגמה בשווקים פיננסיים בהם החלטות סוחרים משפיעות זו על זו דרך ממוצע האוכלוסייה., האלגוריתם מתאים ליישומים של תכנון מרכזי בבעיות עם מספר גדול של סוכנים דוגמת ניהול סיכוני מערכת, ויסות אנרגיה ברשתות חכמות ושוקי הובלה בהם התנהגות הממוצעת חשובה., הפרדיגמה של רגורליזציית אנטרופיה ועידון טמפרטורה מאפשרת איזון בין חקירה לניצול, ולכן מתאימה למצבים מעשיים שבהם יש צורך בחקירה לפני הכוונה מדויקת של מדיניות., האפיון האנליטי של המקרה הליניארי-ריבועי מספק תבניות פרמטריות שניתן לשלב בקלות בתוך רשתות ניורונים או מודלים פרמטריים אחרים לחיסכון במאמץ חישובי ובשיפור יציבות האימון.

Noufel Frikha ואח'
קרא עוד ←
מקודדים אוטומטיים (Autoencoders) במרחב פונקציות
Journal of Machine Learning Research
למידה עמוקה

מקודדים אוטומטיים (Autoencoders) במרחב פונקציות

24 ביוני 2025

מחקר זה מספק כלים מעשיים לפיתוח אוטואנקודרים וVAEs שמטפלים בנתונים שהם פונקציות (למשל מסלולי SDE, שדות פיזיקליים ופתרונות PDE) מבלי להיות תלויים ברזולוציה של הדאטה. המשמעות היא שניתן לאמן מודל על דיסקרטיזציות משתנות ולהפעילו על רזולוציות אחרות (superresolution, inpainting), ליצור דגמים גנרטיביים של שדות פיזיקליים ולגלות ייצוגים לטנטיים שימושיים (למשל להפשטת דינמיקה מורכבת או לבניית מודלים מצבי-מרקוב). מבחינה פרקטית זה עוזר במהירות אימון, בפישוט איסוף נתונים והופך יישומים מדעיים (שימול מולקולרי, זרימות נייר, מודלים שדהיים) לנגישים יותר באמצעות למידה עמוקה על פונקציות.

Justin Bunker ואח'
קרא עוד ←
מידול אוכלוסיות של רשתות אינטראקציה באמצעות מדדי מרחק
Journal of Machine Learning Research
למידה חישובית

מידול אוכלוסיות של רשתות אינטראקציה באמצעות מדדי מרחק

24 ביוני 2025

המאמר מספק כלים אנליטיים לניתוח דוגמאות של משתמשים, לקוחות או ישויות אחרות שבהן הנתונים הם סדרות של אינטראקציות (לדוגמה: מסלולי בדיקה באתר, בדיקות רפואיות חוזרות, יומני בדיקות תקשורת). במקום לסכם קודם כל לגרפים (ומכאן להפסיד מידע סדרתי), השיטה מאפשרת ללמוד אובייקט מרכזי (mode) ורמת פיזור שמסבירים דפוסי מסלולים בחבורה של תצפיות., ביישומים פרקטיים — אנליטיקה של חוויית משתמש, חיזוי התנהגות ניווט, ניתוח נתוני מיקום (LBSN), ואפילו ניתוח רצפים קליניים — ניתן לשאוב ממודל כזה 'ממוצע' של מסלולים ולכמת שונות בין פרטים, לבצע ניתוחי חיזוי עבור ערכים חסרים ולהשוות אוכלוסיות., מבחינה שיטותית, שילוב של מרחקים מותאמים וסכמות MCMC מדויקות (iExchange) נותן פתרון מעשי לבעיית פוסטיריורים 'דו-קשות' (doubly intractable), ולכן מתאים למחקרים בהם נוספות מדדים או מרכיבים מורכבים על חללי אובייקטים לא-איריים.

George Bolt ואח'
קרא עוד ←
הגברת מודלים סיבתיים אדטיביים
Journal of Machine Learning Research
למידה חישובית

הגברת מודלים סיבתיים אדטיביים

24 ביוני 2025

המחקר מראה כיצד להשתמש ב־boosting (רגרסיית L2 עם עצירת מוקדמת) כדי ללמוד את הסדר הסיבתי בין משתנים מתוך נתוני תצפית בלבד, תחת הנחה של מודל רעש-אדיטיבי (CAM). עבור מפתחים ומדעני נתונים, המשמעות המעשית היא שניתן להפעיל שגרת רגרסיה חוזרת ולדרג סדרות משתנים לפי כמות השארית (residual variance) שנותרת אחרי רגרסיה על קודמות, כאשר השיטה אמינה תיאורטית אם משתמשים ב־RKHS ועסקנו בהגבלות סבירות על קירב (eigenvalue decay). בממדים גבוהים מוצע boosting רכיבי המבצע בחירה עדיפה של קשתות (edges) ומעודד גרפים חסכוניים בעזרת AIC ועצירת מוקדמת. היישום מעשי לתחומים כגון ביו־אינפורמטיקה, מערכות ייצור ותעשייה, בהם ניסויים התערבותיים קשים או יקרים, מכיוון השיטה לומדת גרפי סיבה-תוצאה ממצבי תצפית בלבד ועמידה לרעשים ולעיוותים מסוימים.

Maximilian Kertel ו-Nadja Klein
קרא עוד ←
גרדיאנט מדיניות מודע לפונקציית הסקור (score) וערבויות ביצועים באמצעות יציבות ליאפונוב מקומית
Journal of Machine Learning Research
למידת חיזוק

גרדיאנט מדיניות מודע לפונקציית הסקור (score) וערבויות ביצועים באמצעות יציבות ליאפונוב מקומית

24 ביוני 2025

SAGE מיועד לשיפורים מעשיים בבקרת מערכות סטוכסטיות שבהן מדיניות משפיעה על התפלגות הסטייט היציבה וניתן לייצג אותה כמשפחת אקספוננציאלית; דוגמאות בולטות הן רשתות תורים, מערכות איזון עומס ומודלים פיזיקליים כמו איזינג., במקומות שבהם הערכת פונקציית ערך קשה או יקרה (מרחבי מצבים גדולים או אינסופיים), SAGE מפחית את הממד הסטטיסטי בעזרת סטטיסטיקות מספיקות (sufficient statistics) ובכך מאפשר קצב התכנסות מהיר יותר עם שונות נמוכה יותר., הנחות הליאפונוב המקומיות מאפשרות להפעיל את השיטה גם כאשר קיימות מדיניות לא-יציבות באזורי פרמטרים מרוחקים, בתנאי שהאתחול קרוב לאופטימום יציב — זה שימושי בסביבות תפעוליות שבהן אתחולים תכופים יקרים.

Celine Comte ואח'
קרא עוד ←
מודל קיבוץ (Clustering) קמור בהיטל אקראי: מוטיבציה, מימוש וערבויות לשחזור אשכולות
Journal of Machine Learning Research
למידה חישובית

מודל קיבוץ (Clustering) קמור בהיטל אקראי: מוטיבציה, מימוש וערבויות לשחזור אשכולות

24 ביוני 2025

המחקר מאפשר להריץ מודלים של convex clustering על נתונים בעלי ממדים גבוהים בעזרת הטמעה אקראית (random projection) תוך שמירה על יכולת השחזור של קבוצות הנתונים; זה שימושי בארגונים עם מאגרי נתונים בעלי מאפיינים רבים (features) כמו ביואינפורמטיקה, ראייה ממוחשבת או טקסט רציף., הגישה מפחיתה משמעותית את העלות החישובית של אימון מודל הקלאסטרינג הקמור, מה שמאפשר שימוש במודלים מדויקים יותר על מכונות וסביבות זמן ריצה מוגבלות, וכך מתאימה לאנליזה אינטראקטיבית ולמטרות חקר נתונים (exploratory data analysis)., במקרים של נתונים שנוצרו ממודלים סטטיסטיים כמו תערובות גאוסיאניות, המחקר מספק ערבות תאורטית לכך שחלק גדול מהדוגמאות ניתן לשחזר כראוי גם לאחר הקטנת מימד — יתרון לבדיקות איכות קבוצה וליישומי חיבור בין נתונים ממקורות שונים., שיטות כאלה יכולות לשמש כחלק ממערכות קדם-עיבוד (preprocessing) לצמצום ממד לפני יישום אלגוריתמים אחרים הרגישים לממד, או כאמצעי להפצת חישוב רב-ממדי בסביבות מבוזרות עם תקשורת מוגבלת.

Ziwen Wang ואח'
קרא עוד ←
קארה סווישר. ספר בוער: סיפור אהבה טכנולוגי
Administrative Science Quarterly
אחר

קארה סווישר. ספר בוער: סיפור אהבה טכנולוגי

15 ביוני 2025

הסקירה והספר שמולה שימושיים למנהלים, משקיעים ומקבלי מדיניות המעוניינים בתובנות על תרבות ארגונים בתעשיית הטכנולוגיה, דינמיקות כוח פנימיות, תפקיד התקשורת בעיצוב מוניטין חברות ובקבלת החלטות אסטרטגיות. עבור אנשי ניהול, הספר מספק דוגמאות קונקרטיות לאופן שבו מערכות יחסים אישיות, תקשורת ותרבות ארגונית משפיעות על סיכון עסקי, חדשנות וניהול משברים. מומלץ לקריאים בתפקידים קריטיים כדי לשפר הבנת סיכונים לא פורמליים וללמוד על חשיבות השקיפות, נהלי ממשל תאגידי ותקשורת אסטרטגית.

M. Diane Burton
קרא עוד ←
אובדן המומנטום (תנע) באופטימיזציה סטוכסטית בזמן רציף
Journal of Machine Learning Research
למידה חישובית

אובדן המומנטום (תנע) באופטימיזציה סטוכסטית בזמן רציף

5 ביוני 2025

הגישה מספקת מודל רציף-זמן תאורטי שמקשר בין שיטות מעשיות כמו SGD עם מומנטום לבין דינמיקות מכאניות (underdamped) וניתוח גבולות בהם מומנטום או קצב הלמידה מצטמצמים; זה מסייע למקצוענים להבין מתי מומנטום עוזר בעקיפה ממוקומי שיפוע ושימור תנודות., התיאור והניתוח של דיסקרטיזציה סימפלקטית חצי-אימפליציטית נותן מתודולוגיה מעשית ליישום מומנטום יציב גם כאשר פרמטר המסה קטן או משתנה בזמן — רלוונטי לאימון רשתות עמוקות שבהן כיוונון הפרמטרים רגיש., הממצאים תומכים במדיניות של הפחתת מומנטום וקצב למידה בזמן כדי להשיג התכנסות גלובלית בהנחות קמירות, ולכן מספקים הנחיות פרקטיות לבניית שגרות אימון (schedules) שמאזנות חקירה מול ניצול., המסגרת המסכמת את ההשפעות הסטוכסטיות כ־piecewise-deterministic Markov process יכולה לשמש למחקר המשכי על אופטימיזציית ביישום נתונים גדולים, ולהרחבות שיכללו אספקטים אדפטיביים כמו Adam.

Kexin Jin ואח'
קרא עוד ←
סמנטיקה קטגוריאלית (תורת הקטגוריות) של למידת חיזוק קומפוזיציונלית
Journal of Machine Learning Research
למידת חיזוק

סמנטיקה קטגוריאלית (תורת הקטגוריות) של למידת חיזוק קומפוזיציונלית

31 במאי 2025

המסגרת מספקת כלי פורמלי למהנדסי RL לתכנן ולרכיב סביבות ומשימות בצורה מודולרית; במקום לתכנת גבולות ותנאי עצירה ידנית, ניתן להגדיר רכיבים (sub-MDPs) ולחברם באמצעות פעולות pushout/pullback כדי לקבל סביבה משולבת בעלת משמעות אוניברסלית., שימוש בטכניקות כמו 'puncturing' מאפשר לממש הגנות בטיחותיות פשוטות (הסרת מצבים או פעולות מסוכנות) באופן פורמלי, מה שיכול לשפר בדיקות ושרטוט מסלולי פעולה בטוחים במערכות רובוטיות או נהיגה אוטונומית., החיבור עם סימטריות וקבוצות מאפשר בנייה של מתודות למידה חסכוניות שמנצילות חישוביות חוזרת על ידי יצירת קוואציינטים (quotients) — זה מיושם ברשתות הומומורפיות ובמצבים שבהם המרחב מצומצם על ידי סימטריה., שפת ה-zig-zag תומכת בתכנון טקטיקות של למידה-בחלקים (learning-by-parts) ובדיקת תנאים מינימליים שבהם מדיניות מקומית שמורה משאירה על-מנת להיות גם אופטימלית על המערכת המשולבת.

Georgios Bakirtzis ואח'
קרא עוד ←
למידת תכונות (פיצ'רים) המבוססת על דיפאומורפיזם באמצעות אי-שוויונות פואנקרה על גבי מרחב קלט מורחב
Journal of Machine Learning Research
למידה חישובית

למידת תכונות (פיצ'רים) המבוססת על דיפאומורפיזם באמצעות אי-שוויונות פואנקרה על גבי מרחב קלט מורחב

31 במאי 2025

המאמר מספק שיטת בניית תכונות שאפשר להשתמש בה ליצירת סורוגטים מהירים של מודלים פיזיקליים או סימולציות יקרות, כאשר יש גישה לגרדיאנט של המודל (באמצעות דיפרנציאציה אוטומטית או שיטות אדג'וינט). בכך ניתן להאיץ אופטימיזציה, חקר אי וודאות וסנסיטיביות פרמטרית., השיטה שימושית לבניית אנקודרים באוטונומי (autoencoders) בהקשר של דטא שבו הנתונים שוכנים על תת-מניפולד בלתי-לינארי; הדיפאומורפיזם וההרחבה המימדית מאפשרים ללמוד מרחב סמוי בעל יכולת ייצוג גבוהה יותר., ביישומים הנדסיים כמו פתרון בעיות PDE פרמטריות (כמו ה"thermal block" במאמר) אפשר לקבל חיסכון משמעותי בהערכת פלטים על ידי רגרסיה בזן תכונות מממד נמוך, דבר המועיל לדיאגנוסטיקה, כיוונון ותכנון ממוחשב., הגישה מתאימה במיוחד לתרחישים של "small data" בהם מספר הדגימות מוגבל: ניצול מידע גרדיאנטי יחד עם הולכה אינברטיבלית ותוספת מימד מביא לדיוק גבוה יותר ביחס לשיטות מתחרות על מערכי אימון קטנים.

Romain Verdière ואח'
קרא עוד ←
אופטימיזציה קמורה מקוונת אוניברסלית משיגה חסמי מסדר שני
Journal of Machine Learning Research
למידה חישובית

אופטימיזציה קמורה מקוונת אוניברסלית משיגה חסמי מסדר שני

31 במאי 2025

האסטרטגיה מציעה מסגרת מעשית לממש מערכות OCO שצריכות לפעול במצבים לא ידועים מראש לגבי תכונות פונקציות ההפסד (למשל האם הן חזקות-קמירות, exp-concave או פשוטות). במקום לבחור אלגוריתם ספציפי מראש, ניתן להריץ מספר מומחים (algorithms קיימים) כ"קופסאות שחורות" ולתת למטא-אלגוריתם לשלב את החלטותיהם עם הבטחה תיאורטית חזקה., ביישומים פרקטיים כמו אופטימיזציה אונליין למשימות ניטור, תזמון, או עדכון פרמטרים בזמן אמת (למשל בשרתי פרסום, מערכות המלצה או אופטימיזציית תהליכים), השיטה מאפשרת לקבל ביצועים קרובים לאופטימליים ללא ידיעה מוקדמת של מבנה ההפסד וכך חוסכת כוונון היפרפרמטרים ידני., ההרחבה ל"חישוב קומפוזיטי" מאפשרת לשלב רגולריזציות מעשיות (למשל sparsity או trace-norm) ולשמור על היתרונות התיאורטיים — משמעותי למודלים שמשלבים קונסטריינטים או קידוד prior בתהליך הלמידה האונליין.

Lijun Zhang ואח'
קרא עוד ←
מודלים גנרטיביים עמוקים: סיבוכיות, ממדיות וקירוב
Journal of Machine Learning Research
בינה מלאכותית גנרטיבית

מודלים גנרטיביים עמוקים: סיבוכיות, ממדיות וקירוב

31 במאי 2025

המחקר מספק הבנה תיאורטית מדויקת למתכנני מערכות גנרטיביות: הוא מראה כי ניתן להשתמש בקלטים בעלי ממד נמוך משמעותית כדי לייצר נתונים על מניפולות מממד גבוה, אך יש לשקול עלות חישובית גבוהה יותר. משמעותי בהגדרת ארכיטקטורת המודלים ובבחירת ממד הלטנטי בעיצוב GAN/VAEs., בפועל, תוצאות המחקר מסייעות להסביר מדוע מודלים גנרטיביים מצליחים לייצר תמונות ומבנים מורכבים גם עם מרחבי לטנט קטנים, ומזהירות מפני הגדרת ממד לטנט נמוך מדי ללא הגדלה נאותה של המודל., העבודה יכולה לשמש כהנחיה עבור מהנדסי ML בבחירת גודל רשת, עומק ורוחב בהתאם למטרה — איזון בין דיוק הדגימה לעלות המשאבים החישוביים, וכן כבסיס למחקר עכשווי על שיטות יעילות יותר למילוי מרחבים.

Kevin Wang ואח'
קרא עוד ←
BitNet: קדם-אימון בביט אחד למודלי שפה גדולים
Journal of Machine Learning Research
מודלים גדולים

BitNet: קדם-אימון בביט אחד למודלי שפה גדולים

31 במאי 2025

BitNet מאפשר פריסה חסכונית של מודלים גדולים: חברות ושירותי ענן יכולים להפעיל LLMים גדולים יותר על חומרה קיימת עם פחות זיכרון וצריכת אנרגיה, מה שמקטין עלויות תפעול ומצריך פחות תשתית., בזכות קיצוץ משמעותי בזיכרון ובלתלות בחישובים בצורת כפל־נקודה־צפה, ניתן להאיץ אינפרנס בזמן אמת (lower latency) ולשפר throughput עבור יישומים כמו שירותי צ'אט, מנועי חיפוש מבוססי שפה ומערכות סיכום חיות., הארכיטקטורה תומכת בקאשינג של KV בכמות ביטים נמוכה (למשל 4 ביט) ללא נפילת ביצועים משמעותית, מה שמועיל למטלות בעלות הקשר ארוך כמו עיבוד מסמכים ארוכים ושיחות מתמשכות., חוקי סקלינג ואנליזות האנרגיה מספקים הנחיות מעשיות לתכנון דגמי LLM חסכוניים מבחינת אנרגיה — כלי תכנון עבור מהנדסי חומרה ותוכנה בפיתוח חומרה ייעודית ל־1 ביט.

Hongyu Wang ואח'
קרא עוד ←
אסימפטוטיקה מדויקת בממדים גבוהים לכימותן של העברות הטרוגניות
Journal of Machine Learning Research
למידה חישובית

אסימפטוטיקה מדויקת בממדים גבוהים לכימותן של העברות הטרוגניות

31 במאי 2025

המאמר מספק נוסחאות מקוריות לשטחי רגרסיה משותפים (HPS) המאפשרות למהנדסי למידת מכונה לחזות מראש אם שילוב דגימות ממקור חיצוני ישפר או יפגע בביצוע על משימת היעד, לפי יחס דגימות-ממד ורמת סטיות הנתונים., הניתוחים שימושיים בעיצוב פרוטוקולי אימון ואיסוף נתונים: הם מראים מתי עדיף לשקלל, לדלל או להתעלם ממקור נתונים חיצוני במערכות עם מאפייני תכונות שונים, ונותנים קריטריונים ברורים לקבלת החלטות מבוססות מדד., הממצאים רלוונטיים לאופטימיזציה של שיטות טרנספר רכות (SPS) ורידג׳ינג: המאמר מסביר מדוע וריאציות פשוטות של רגולריזציה או הקטנת משקל המקור מדמות את התנהגות ה׳סופט׳ ומפחיתות העברה שלילית., בהרחבה למולטיטסקינג, התוצאות עוזרות לקבוע את הממד האופטימלי לשיתוף פרמטרים (rank) כאשר משימות חולקות תכונות, ובכך מסייעות בתכנון ארכיטקטורות ופרמטריזציות במחולל משימות מרובות.

Fan Yang ואח'
קרא עוד ←
מינימום גלובליים ניתנים לפירוש של רשתות נוירונים עמוקות ReLU על נתונים ניתנים להפרדה באופן סדרתי
Journal of Machine Learning Research
למידה עמוקה

מינימום גלובליים ניתנים לפירוש של רשתות נוירונים עמוקות ReLU על נתונים ניתנים להפרדה באופן סדרתי

31 במאי 2025

העבודה מראה איך לבנות רשתות ReLU שעושות 'אינטרפולציה' מדויקת (אפס אובדן) על סוגי נתונים בעלי מבנה גיאומטרי מסוים, בלי תלות במספר הדוגמאות. המשמעות הפרקטית: אם נתוני האימון מסודרים כקלאסטרים נפרדים או בצורה שניתן לבצע סדרה של הפרדות אחת-על-כולם, אז אפשר לתכנן פרמטרים מפורשים לרשת עמוקה שממפה כל מחלקה לנקודה יחידה ומשלים את הסיווג בשכבה האחרונה. זה שימושי להבנה אינטרפרטבילית של מה השכבות עושות (לדוגמה: השכבות החבויות 'דוחסות' שונות בתוך-מחלקה ואילו השכבה הסופית מפעילה מאפייני least-squares), ולתכנון ארכיטקטורות עם מספר פרמטרים מצומצם שניתן לנתח תיאורטית. בנוסף תובנות אלה מקשרות את התנהגות הרשת לתופעות נצפות כמו "neural collapse" ומספקות כלים לבדיקת מובנות המבנה של מינימיזטורים.

Thomas Chen ו-Patrícia Muñoz Ewald
קרא עוד ←
ניתוח דק-גרעיני ואלגוריתמים מהירים יותר לפתרון איטרטיבי של מערכות ליניאריות
Journal of Machine Learning Research
למידה חישובית

ניתוח דק-גרעיני ואלגוריתמים מהירים יותר לפתרון איטרטיבי של מערכות ליניאריות

31 במאי 2025

המאמר מראה כיצד ניתן לפתור מערכות לינאריות גדולות (למשל ברגרסיות רגולריות, רגרסיית רידג' kernel ופעולות Newton-type) מהר יותר כשהמטריצה מציגה מבנה ספקטרלי "סיגנלי+רעש" — כלומר כמה ערכים סינגולריים גדולים ואז זנב סדיר. עבור מהנדסי ML זה אומר שהאימון או החיזוי המסתמכים על פתרון מערכות אלה יכולים להיות מהירים משמעותית אם מתאימים את השיטה לפרופיל הספקטרום., האלגוריתם שימושי לפתרונות איטרטיביים בשגרות טיפול בגרדיאנט, מטריצות גרעיניות בחיזוי גאוסי, ותהליכים קורנליים: אפשר לשלב את Sketch-and-Project כמקרבי פנימי (inner solver) בתוך שיטות קדם־התנחלות (preconditioning) ולקבל זמן ריצה נמוך יותר במקרים מעשיים., הניתוח מאפשר לבחור גודל סקיצה וסוג סקיצ'ינג (LESS-uniform, Hadamard preprocessing) באופן שמאזן עלויות חישוביות לבין קצב התכנסות, וכולל דרישות לדיוק בתהליך פתרון המשימות הפנימיות (inexact projections) כך שניתן ליישם את השיטה גם בסביבת חישוב דחוסה ובלתי מדויקת.

Michał Dereziński ואח'
קרא עוד ←
למידת חיזוק הופכית (IRL) באנטרופיה סיבתית מרבית במשחקי שדה ממוצע ובמסגרת GNEP (בעיית שיווי־משקל נאש מוכלל) ללמידת חיזוק קדמית
Journal of Machine Learning Research
מערכות מרובות-סוכנים ובינה קולקטיבית

למידת חיזוק הופכית (IRL) באנטרופיה סיבתית מרבית במשחקי שדה ממוצע ובמסגרת GNEP (בעיית שיווי־משקל נאש מוכלל) ללמידת חיזוק קדמית

31 במאי 2025

המאמר מספק כלים לשחזור פונקציות תגמול ממנהגים של מומחים בסיטואציות עם אוכלוסיות גדולות של סוכנים שמתקשרים דרך התפלגות מצב משותפת, כלומר ישירות ישימות לתחומים כמו תכנון מדיניות בקנה מידה גדול, מודלים של התפשטות מחלות, אבטחת רשתות ומודלים כלכליים מרובי משתתפים., השיטה הקמבית על בסיס מדדי תפוסת-פעולה מאפשרת פתרון יציב ונגיש של בעיות IRL אינפיניטיות-אופק, מה שמקל יישום אלגוריתמים פרקטיים שבהם נדרשת התאמה למידע נאמד מהתנהגות בפועל ולא מפורמט תגמולים ידוע., הצגת ה-MFG בתור GNEP פותחת אפשרות להשתמש באלגוריתמים מספריים קיימים מתחום אופטימיזציה למשחקים כלליים על מנת לחשב שיווי משקל שדה ממוצע בסביבות לא־ליניאריות, מה שמפחית את התלות בתנאי כיווץ מחמירים ומגדיל את טווח היישומים.

Berkay Anahtarci ואח'
קרא עוד ←
מידת ההשפעה בין-יחידתית (אינטרפרנציה): מסגרת כללית להסקה סיבתית בנוכחות אינטרפרנציה
Journal of Machine Learning Research
למידה חישובית

מידת ההשפעה בין-יחידתית (אינטרפרנציה): מסגרת כללית להסקה סיבתית בנוכחות אינטרפרנציה

31 במאי 2025

המסגרת מאפשרת לחוקרים ומתכנתי ניסויים להעריך אפקטים ישירים וספילאובר גם כאשר מבנה ההפרעה ברשת אינו ידוע או מסובך, וזה שימושי בניסויים חברתיים, בריאותיים וטכנולוגיים שבהם השפעות בין יחידים נפוצות., ניתן לשלב את השיטה בניתוח תוכניות תמחור, חיסונים או תמריצים בקבוצות שבהן התנהגות של אחד יכולה להשפיע על אחרים, ובכך לקבל הערכות מדויקות יותר של התועלת נטו של טיפול., הכלים הבייסיאניים וה-DDPM מאפשרים קיבוצי יחידות עם דפוסי הפרעה דומים ולספק אינטגרציה של ידע תחומי לצורך מיצוי דיוק ובעקבות זאת חישוב רווח סביר של תכניות מדיניות המבוססות על ניסויים מעשיים., האלגוריתם הוצג כמימוש מעשי ויכול לשמש גם כאמצעי לדיagnostic של חשיפות לא מדויקות במפות חשיפה קיימות ולהציע אלטרנטיבה אדפטיבית במקום להנחות סטטיות.

Yuki Ohnishi ואח'
קרא עוד ←
על יכולתן של רשתות עמוקות ללמוד סימטריות מן הנתונים – תורת הגרעין (Kernel) הנוירלי
Journal of Machine Learning Research
למידה עמוקה

על יכולתן של רשתות עמוקות ללמוד סימטריות מן הנתונים – תורת הגרעין (Kernel) הנוירלי

31 במאי 2025

המאמר מספק כלים תאורטיים לפירוש מדוע מודלים סטנדרטיים (MLP, CNN, ViT) נכשלים להכליל אי־פעם סימטריות שלא הוטמעו בארכיטקטורה או לא נחשפו בשפע באוגמנטציה; משמע, הוא מסייע למהנדסים להחליט מתי כדאי להטמיע אקוויברנטיות בעיצוב המודל לעומת שימוש באוגמנטציות או באיסוף נתונים נוסף., הנוסחה הספקטרלית המתקבלת מאפשרת להעריך עבור מערכי נתונים סימטריים פרמטרית (מפרידות מחלקות, צפיפות האורביט) האם רשת בקרבת NTK תצליח להכליל — שימושי לתכנון דיאטה של אימון, בחירת ארכיטקטורה ומדיניות אוגמנטציה בפרויקטים בראייה ממוחשבת., העבודה מצביעה על דרכים לשיפור: אם אי אפשר להוסיף דוגמי אימון לכל הטרנספורמציות, יש מקום לפתח שיטות למידה של סימטריות (learned equivariances), losses עצמיים (self-supervised) או ארכיטקטורות דינמיות; זה רלוונטי בפיתוח מערכות ראייה לרובוטיקה, זיהוי עצמים בתנאים חריגים והנגשה של מערכי הדרכה קטנים.

Andrea Perin ו-St´ephane Deny
קרא עוד ←
על זיהוי מודל וחיזוי מחוץ למדגם של רגרסיית רכיבים עיקריים (PCR) עם יישומים לבקרה סינתטית
Journal of Machine Learning Research
למידה חישובית

על זיהוי מודל וחיזוי מחוץ למדגם של רגרסיית רכיבים עיקריים (PCR) עם יישומים לבקרה סינתטית

31 במאי 2025

המאמר מראה כיצד להשתמש ב־PCR במצבים בהם תכונות הניסוי נמדדות עם רעש ונעדרות חלקית, ולא ניתן להניח דגימה אקראית של הדוגמאות; זו תובנה שימושית במחקרי מדיניות ובניתוח פאנלים בהם רוצים לחזות תוצאות חדשות עבור נקודות עיתיות שלא נראו באימון., התנאי הלינארי של 'שילוב תת־מרחבים' (rowspan(X′) ⊆ rowspan(X)) הוא אבחנה פשוטה שניתן לבחון בנתונים ובודקת האם המרחב הלינארי של הדוגמאות החדשות מוכל במרחב של הדוגמאות הלימודיות — אם כן, PCR צפוי לגeneralize היטב גם תחת covariate shift; המחקר מציע גם מבחן פרקטי להערכה זו., העבודה מספקת הבטחות תיאורטיות לשימוש ב־PCR כחלופה לאלגוריתמי תיקון רעש שמחייבים ידע על חלוקת הרעשים, ולכן מתאימה ליישומים פרקטיים שבהם מידע מפורט על מודל הרעש אינו נגיש., היישום ל־synthetic controls מספק דרך מדוקדקת להעריך האם שיטות PCR‑מבוססות יכולות להעריך היטב מתוי מדיניות ולקבל אומדנים של 'מה היה קורה אלמלא הטיפול' בתצפיות פאנל.

Anish Agarwal ואח'
קרא עוד ←
ארבעה איפיונים אקסיומטיים לשיטת הייחוס של גרדיאנטים משולבים
Journal of Machine Learning Research
בינה מלאכותית מסבירה

ארבעה איפיונים אקסיומטיים לשיטת הייחוס של גרדיאנטים משולבים

24 במאי 2025

עבור מנהלים ואנשי עסקים: המחקר מספק בסיס תיאורטי חזק לשימוש ב־Integrated Gradients כשיטת הסבר למודלים מבוססי רשתות עצביות. אם בארגון אתם משתמשים ב־IG כדי להסביר החלטות מודלים (למשל לזיהוי סיבות להחלטת סיווג, לתאימות רגולטורית או לפרשנות תוצרים ללקוחות), המאמר מראה תחת אילו הנחות וקריטריונים IG היא הבחירה ה"נכונה" והיחידה שנותנת את התכונות המבוקשות. בנוסף, המחקר מראה ש־IG יציב תחת קירובים שגורמים ל־ReLU לריכוך (softplus), מה שמרגיע לגבי שימוש מעשי ב־IG על רשתות נפוצות שאינן אנליטיות. משמעותית לאנשי מוצר וניהול: המחקר מסייע להצדיק מדיניות בחירה של שיטת הסבר, להבין מגבלות וחוזקות שלה ולבחור באקסיומות שמתאימות לדרישות רגולטוריות או עסקיות.

Daniel Lundstrom ו-Meisam Razaviyayn
קרא עוד ←
על התכונות הסטטיסטיות של מודלים גנרטיביים יריביים (אדברסריים) עבור נתונים בעלי ממד פנימי נמוך
Journal of Machine Learning Research
בינה מלאכותית גנרטיבית

על התכונות הסטטיסטיות של מודלים גנרטיביים יריביים (אדברסריים) עבור נתונים בעלי ממד פנימי נמוך

24 במאי 2025

התוצאות מראות שאנשי פרקטיקה יכולים לעצב ארכיטקטורות גנרטור/אנקודר בצורה מודעת לממד הפנימי של הנתונים כדי להשיג שגיאות סטטיסטיות טובות יותר בהערכה של התפלגויות, במיוחד כאשר נתוני תמונה או אותות מצויים על מונית נמוכה מממדית., הניתוחים מספקים מדד ברור לכמות הדגימות הדרושה על מנת להבטיח מרחק וורסטשטיין קטן בין התפלגות אמיתית לבין התוצאה של GAN או BiGAN, ומנחים כיצד להתאים את עומק ורוחב הרשת ביחס לחלקים החלקיים של הבעיה., לצרכי מהנדסי ML, המחקר מראה שאפשר להימנע מקללת הממד הגבוה על ידי ניצול תכונות אינטנסיביות של הנתונים, וכי ניתן לתכנן גנרטורים שאינם צריכים להינתח בקנה מידה של הממד האמיתי של מרחב הפיקסלים., התובנות על דרישות המדגם עבור m (מספר דגימות מהלטנט) מול n (דגימות מהנתונים) מסייעות לתכנן מערכי אימון מעשיים כאשר ניתן ליצור דגימות לטנטיות בכמות רבה.

Saptarshi Chakraborty ו-Peter L. Bartlett
קרא עוד ←
ClimSim-Online: מערך נתונים גדול ורב-קנה-מידה ומסגרת לאמולציית אקלים (חיקוי) היברידית המשלבת פיזיקה ולמידת מכונה
Journal of Machine Learning Research
AI לאקלים, אנרגיה וסביבה

ClimSim-Online: מערך נתונים גדול ורב-קנה-מידה ומסגרת לאמולציית אקלים (חיקוי) היברידית המשלבת פיזיקה ולמידת מכונה

30 באפריל 2025

המאגר מאפשר למפתחי ML לאמן אמולטורים של פרמטריזציות אטמוספריות (החל ממגמות חימום ולחות ועד פליטות קרינה ומשקעים) על דוגמאות שנוצרו ממודלים שמריצים פתרון מפורט בתוך כל עמודה אטמוספרית, ובכך לחסוך את הצורך להריץ סימולציות חשבונאיות כבדות בזמן פיתוח., התשתית המכולתית שנבנתה מאפשרת לחוקרים ולמהנדסי אקלימיה להטעין מודל TorchScript לתוך סימולטור Fortran קיים (E3SM-MMF), לבצע בדיקות מקוונות (hybrid online) ולמדוד האם שיפורי ביצוע אופליין מתורגמים לשיפורים של סטטיסטיקות אקלימיות מרובות-שנים., לארגונים ותעשיות שעוסקות בהערכות סיכונים אקלימיים, המערכת מספק מסלול אפשרי להגדלת דיוק תחזיות משקעים קיצוניים ועננים בעלות נמוכה יחסית, מה שיכול להאיץ מחקר מדיניות ויישומים פרקטיים כגון הערכות נזקי מזג אוויר קיצוני.

Sungduk Yu ואח'
קרא עוד ←
אופטימיזציה דו-רמתית (עליונה לא קמורה, תחתונה קמורה בחוזקה) כמעט-מיטבית עם אורקלים מדרגה ראשונה (גרדיאנט) בלבד
Journal of Machine Learning Research
למידה חישובית

אופטימיזציה דו-רמתית (עליונה לא קמורה, תחתונה קמורה בחוזקה) כמעט-מיטבית עם אורקלים מדרגה ראשונה (גרדיאנט) בלבד

30 באפריל 2025

המאמר נותן כלי פרקטי ללימוד היפרפרמטרים, ניקוי מידע ואימון ביילבלי של מודלים גדולים מבלי להזדקק לחישוב מוצרי הייסיאן יקרים; זאת מאפשרת החלה קלה יותר במערכות מבוזרות ורשתות ענק בהן חישוב HVP יקר או בלתי נגיש., האלגוריתם והשכלולים הסטוכסטיים מאפשרים יישום בעבודה של אימון מודלים על נתונים רעשים או בשיטות reweighting לדאטה מטוהרת, שם רוצים ללמוד משקלים לדוגמאות או משאבים ללא עלות חישובית גבוהה., גרסת ההאצה והגרסה המפריעה מספקות מנגנונים שניתנים לשילוב במערכות פיתוח ואופטימיזציה כדי להימנע מהיתקעות בנקודות אוכף או בסדל-פוינטס ולשפר את קצב ההיתכנות המקומלית של תוצאות האימון.

Lesi Chen ואח'
קרא עוד ←
תפקידים מרכזיים של רכיבים בלתי־משתנים מותנים במסגרת התאמת תחום: תיאוריה ואלגוריתמים
Journal of Machine Learning Research
למידה חישובית

תפקידים מרכזיים של רכיבים בלתי־משתנים מותנים במסגרת התאמת תחום: תיאוריה ואלגוריתמים

30 באפריל 2025

המאמר מציע כלים מעשיים לשיפור התאמת דומיין כאשר יש גישה למספר מאגרי מקור מתויגים ולדאטה ללא תיוג בתחום היעד: ניתן לזהות תכונות שהתפלגותן מותנית בתווית ואינה משתנה (CICs), לתקן שינוי בתפלגות התוויות באמצעות משקלים חשיבות (IW-CIP) ולבנות מאזני סיכון המשמשים לאבחון כשל של אלגוריתמים אחרים ללא תויות יעד., JointDIP מספק דרך לשלב תכונות CIC עם התאמת ייצוגים בין המקור ליעד כך שנמנעים מקרים בהם שיטות התאם-מרחב (DIP) לומדות תכונות ה"הופכות תוויות" (label-flipping), ובכך משפר את העמידות בשימוש פרקטי במודלים העמוקים., השיטות וההערכות התיאורטיות מאפשרות למפתחים ומדעני נתונים להעריך את מהימנות שיטות DA על דומיינים חדשים ולבחור בין גישה שמנצלת מטרה אחת מטילת סיכונים (CIP/IW-CIP) לבין גישה שמנצלת נתוני יעד לא מתויגים (DIP/JointDIP) בהתאם לזיהוי CICs וזמינות מקורות.

Keru Wu ואח'
קרא עוד ←
אלגוריתם מבוזר לעקיבת גרדיאנט פרוקסימלי לאופטימיזציה (קומפוזיטית) על יריעות רימניות
Journal of Machine Learning Research
מערכות מרובות-סוכנים ובינה קולקטיבית

אלגוריתם מבוזר לעקיבת גרדיאנט פרוקסימלי לאופטימיזציה (קומפוזיטית) על יריעות רימניות

30 באפריל 2025

המאמר רלוונטי למערכות מבוזרות שבהן נתונים או חישובים מפוזרים על מספר סוכנים שמחוברים ברשת תקשורת מקומית, כמו חישוב מקבילי של PCA חסומה, ניתוח מרחבים דמוגרפיים, או פקטוריזציה של מטריצות תחת אילוצים אורטונורמיים. האלגוריתם מאפשר לכל סוכן לבצע עדכון מקומי עם סיבוב אחד של תקשורת לכל איטרציה ולשמור על פרטיות נתונים מקומיים., יישומים מעשיים כוללים למידה מבוזרת על מכשירים שולטים, חישובים מדעיים על אשכולות חישוב, ויישומים בתחום הבריאות ודאטה הרגישים שבהם מידע נשאר מקומי אך יש צורך לפתור אופטימיזציה גלובלית תחת אילוצים גיאומטריים., התרומה התיאורטית של שיפור סיבוכיות ה-O(epsilon^{-2}) משפרת את התקציב התקשורתי הדרוש להשגת דיוק נתון, ולכן יעילה במיוחד בסביבות שבהן תקשורת היא המשאב הקריטי.

Lei Wang ואח'
קרא עוד ←
"מה שונה בין מערכי הנתונים הללו?" מסגרת להסברת שינויי התפלגות נתונים
Journal of Machine Learning Research
בינה מלאכותית מסבירה

"מה שונה בין מערכי הנתונים הללו?" מסגרת להסברת שינויי התפלגות נתונים

30 באפריל 2025

המסגרת שימושית למנהלי מוצר, מהנדסי נתונים ומדעני נתונים שרוצים להבין באופן אנושי ומעשי איך שני מאגרי נתונים שונים — בין אם מקורם שונה, בין אם אחד סינתטי — וכיצד ההבדלים הללו משפיעים על חשיבות תכונות וביצועי מודלים. הכלים מזהים דוגמאות 'אשם' שמניעות הבדל, מפרט-prototypes של שכנות נתונים שיכולות לכוון איסוף/ייצור נתונים נוסף, ומודדים כיסוי פרוטוטיפי (AUCC) כדי לאמוד עד כמה פרוטוטיפים מסכמים את מאגר הנתונים. המשמעות המעשית: שיפור דורג של נתונים סינתטיים, זיהוי הטיות, תיקון מדיניות איסוף נתונים לפני פריסה, וקיצור זמן חקר תקלות בבסיסי נתונים.

Varun Babbar* ואח'
קרא עוד ←
רגרסיית רכס מבוססת-גרעין אדפטיבית ומבוזרת: שיטת למידה מבוזרת ברת-יישום עבור איי נתונים
Journal of Machine Learning Research
אבטחת מידע ופרטיות ב-AI

רגרסיית רכס מבוססת-גרעין אדפטיבית ומבוזרת: שיטת למידה מבוזרת ברת-יישום עבור איי נתונים

31 במרץ 2025

השיטה מאפשרת לארגונים המחזיקים במאגרים מפוזרים (בתי חולים, חברות קמעונאיות, ספקיות שירותים פיננסיים) לשתף פעולה באימון מודלים חיזוייים מבלי להעביר את הנתונים הגולמיים; הם ישדרו רק מקדמי בסיס שאינם חושפים דוגמאות פרטיות., מערכות פדרטד־לרנינג ומערכי למידה מבוזרת יוכלו ללמוד פרמטרים אופטימליים באופן מקומי בעזרת הערכה גלובלית משותפת, ובכך להימנע מתת־רגולציה או תת־התאמה הנובעים מבחירת היפרפרמטרים רק לפי תת־מדגם מקומי., שימוש בפרקטיקה זו יכול לשפר יישומים תעשייתיים כגון חיזוי מחירי רכב משומש וטיוב ביצועי קוד GPU, שם שילוב מידע מפוזר משפר דיוק ללא פגיעה בפרטיות המשתמשים., גישת AdaDKRR דורשת תקשורת נמוכה יחסית (שידור מקדמי הבסיס בלבד) ויכולה להשתלב בסביבות עם מגבלות רגולטוריות או טכניות על שיתוף נתונים.

Shao-Bo Lin ואח'
קרא עוד ←
שיטות מונחות-עקרונות המבוססות על קנס ללמידת חיזוק דו-רמתית וללמידת חיזוק מתוך משוב אנושי (RLHF)
Journal of Machine Learning Research
למידת חיזוק

שיטות מונחות-עקרונות המבוססות על קנס ללמידת חיזוק דו-רמתית וללמידת חיזוק מתוך משוב אנושי (RLHF)

31 בינואר 2025

המאמר נותן כלי פרקטי לתכנון מערכות שבהן מדיניות של סוכן תלויה בפרמטרים שעוצבו על ידי גורם עליון — לדוגמה בעיצוב תגמולים, בעיצוב תמריצים, וב-RL מפי המשתמש (RLHF). הפתרון מאפשר למנהלי מערכת לעצב תגמול או פרמטר חיצוני אחר, ולהבטיח שהתגובה של הלומד הפנימי תהיה קרובה לתגובה אופטימלית., ביישומים של RLHF (למידת חיזוק מפי העדפות אנוש), השיטה מאפשרת לאמן את פונקציית התגמול והסוכן בו זמנית במסגרת מבוקרת, עם הגדרות ברורות לגבי כיצד להטיל עונש על חוסר-אופטימליות של המערכת התחתונה ולחשב גרדיאנטים יעילים., בעיצוב תמריצים ומערכות רב-שחקניות (Stackelberg או משחקים זירוסום), השיטה מספקת מסלול אלגוריתמי לכיוון פתרונות בהם המפעיל העליון יכול לשפר מטריקות חיצוניות (כמו רווח חברתי) בעזרת שינויים שגורמים לשחקנים התחתונים להגיע לאיזון רצוי.

Han Shen ואח'
קרא עוד ←
האם AI יכול להתעלות על מנהלים אנושיים ב בקבלת החלטות ניהול תפעוליות?
The 18th International Days of Statistics and Economics, Prague, September 5-6, 2024
קבלת החלטות עם AI

האם AI יכול להתעלות על מנהלים אנושיים ב בקבלת החלטות ניהול תפעוליות?

4 בספטמבר 2024

המחקר מראה שלכלי שפה מתקדמים יש פוטנציאל לסייע משמעותית למנהלים תפעוליים בקבלת החלטות יומיומיות: שיפור איכות ההחלטות, מתן חלופות מעשיות ופתרונות יצירתיים. למנהלים ולמובילי ארגונים זה אומר ששילוב LLM ככלי תומך יכול לחסוך זמן, להקטין שונות בין החלטות ולשפר תהליכי קביעת יעדים ותכנון יעילות. עם זאת, יש להיזהר ולהשתמש ב‑AI ככלי משליך/מייעץ ולא כתחליף מלא, בשל מגבלות בדיקה שטחית של היתכנות ביצוע וגורמים רגשיים ואינטגרטיביים בתהליכי יישום החלטות.

Jonathan Kuzmanko ו-Lucie Vrbová
קרא עוד ←