איפה אפשר לקרוא חדשות AI בעברית?

זירת AI הוא אתר חדשות AI מוביל בישראל, המתעדכן מדי יום עם חדשות בינה מלאכותית בעברית. האתר מכסה עדכוני AI מרחבי העולם, כולל חדשות על ChatGPT, Claude, Gemini, סטארטאפי AI ומחקרים פורצי דרך. כל התכנים מותאמים לקהילה העסקית והמדעית בישראל.

מה זה זירת AI?

זירת AI הוא אתר חדשות בינה מלאכותית מוביל בישראל. האתר מספק חדשות AI עדכניות בעברית, דירוג והשוואת מודלי AI, סקירות כלי AI, מחקרים אקדמיים ואירועי AI. זירת AI מתעדכן מדי יום ומכסה את כל ההתפתחויות החשובות בעולם הבינה המלאכותית.

איך אני יכול להישאר מעודכן עם חדשות AI?

תוכלו להירשם לניוזלטר השבועי של זירת AI, לעקוב אחרי העמוד שלנו ברשתות החברתיות, או לבקר באתר חדשות AI שלנו באופן קבוע. אנו מפרסמים חדשות AI חדשות מדי יום, כולל עדכונים על מודלים חדשים, כלי AI וחדשות טכנולוגיה.

איך אני יכול למצוא כלי AI מתאים לעסק שלי?

במאגר הכלים שלנו תוכלו לסנן לפי קטגוריות שונות כמו כתיבה, תמונה, קוד, ניתוח נתונים ועוד. כל כלי כולל ביקורת מפורטת, דירוג, מידע על מחיר ויתרונות וחסרונות.

איך אני יכול למצוא אירועי AI בישראל?

בעמוד האירועים שלנו תמצאו רשימה מעודכנת של כנסים, Meetups, Webinars וסדנאות בתחום הבינה המלאכותית בישראל. כל אירוע כולל פרטי הרשמה, מיקום ותאריכים.

מה מצא מחקר הרווארד לגבי דיוק אבחון של מודל AI לעומת רופאים במיון?

במחקר שטח על 76 מטופלים במיון, הושוו אבחנות של שני רופאים מומחים למחלות פנימיות לאבחנות של מודלי שפה. במקרי המיון הראשוניים, מודל o1 נתן אבחנה מדויקת או קרובה מאוד ב‑67% מהמקרים, לעומת 55% ו‑50% אצל שני הרופאים.

איך בוצעה ההשוואה בין ה-AI לרופאים כדי למנוע הטיה?

המודלים קיבלו בדיוק את אותו מידע שהיה זמין בזמן אמת ברשומות הרפואיות האלקטרוניות, ללא “עיבוד מראש” של הנתונים. לאחר מכן שני רופאים אחרים העריכו את איכות האבחנות באופן עיוור, בלי לדעת אם האבחנה נוצרה על ידי רופא או על ידי המודל.

מה זה ניסוי פרוספקטיבי ולמה החוקרים אומרים שהוא נחוץ כאן?

ניסוי פרוספקטיבי הוא מחקר שבו בודקים כלי או התערבות קדימה בזמן, בסביבת טיפול אמיתית, תוך מדידה שיטתית של תוצאות. החוקרים מדגישים שממצאי הדיוק על בסיס טקסט בלבד אינם מספיקים כדי לאשר שימוש קליני בהחלטות קריטיות, ולכן נדרשים ניסויים כאלה.

מה המגבלות והסיכונים שהמחקר מציין בשימוש במודלי שפה לאבחון רפואי?

המחקר מדגיש שהבדיקה הייתה על ביצועים מבוססי טקסט, ושמודלי יסוד מוגבלים יותר בהיגיון מול קלט שאינו טקסט. בנוסף, הועלתה אזהרה שאין כיום מסגרת אחריות פורמלית לאבחנות AI, ומטופלים עדיין מצפים שבני אדם יובילו החלטות של חיים ומוות.

למה נשמעה ביקורת על ההשוואה לרופאים, ומה הטיעון המרכזי של רופאי מיון?

הביקורת טוענת שההשוואה נעשתה מול מומחי רפואה פנימית ולא מול רופאי מיון, ולכן אינה משקפת התמחות רלוונטית לתנאי המיון. בנוסף הודגש שמטרת רופא מיון אינה “לנחש” אבחנה סופית, אלא לזהות מיידית מצבים מסכני חיים ולהבטיח טיפול דחוף.

איך הממצאים יכולים להשפיע על מערכת הבריאות בישראל?

בישראל יש עומס במיונים ומחסור בכוח אדם, ולכן כלי עזר קליניים מבוססי מודלי שפה עשויים לתמוך ברופאים באבחון, במיוחד בשעות שיא ובמצבי לחץ. לצד ההזדמנות, המחקר מרמז על צורך בתשתיות רגולטוריות ומסגרות אחריות שיתאימו לשימוש בטוח במציאות המקומית.

מודל AI מול רופאים: תוצאות מפתיעות ממחקר שטח

מחקר חדש שפורסם השבוע בכתב העת Science בוחן את יכולות מודלי השפה הגדולים של OpenAI בהקשרים רפואיים מגוונים, כשהתוצאות מעלות שאלות מהותיות לגבי התפקיד העתידי של AI ברפואה הקלינית.

המחקר, שהתנהל תחת הנחיית רופאים ומדעני מחשב מבית הספר לרפואה של הרווארד ומרכז הרפואי Beth Israel Deaconess, בחן 76 מטופלים שהגיעו למיון. החוקרים השוו בין אבחנות שניתנו על ידי שני רופאים מומחים למחלות פנימיות לבין אבחנות שיצרו מודלי o1 ו-4o של OpenAI. שני רופאים אחרים העריכו את האבחנות באופן עיוור, ללא ידיעה מהו מקורן.

התוצאות היו בולטות במיוחד: במקרי המיון הראשוניים, כאשר כמות המידע המינימלית והדחיפות מקסימלית, מודל o1 הגיע לאבחנה מדויקת או קרובה מאוד ב-67% מהמקרים. לעומת זאת, אחד הרופאים הגיע לדיוק של 55% והשני ל-50%.

מבחן אמת במציאות קלינית

אחד ההיבטים המשמעותיים במחקר הוא שהחוקרים לא "עיבדו מראש" את הנתונים. מודלי ה-AI קיבלו בדיוק את אותו מידע שהיה זמין ברשומות הרפואיות האלקטרוניות בזמן האמת של כל אבחנה, בדיוק כפי שרופאים היו מקבלים במהלך העבודה השגרתית שלהם.

"בדקנו את מודל ה-AI כמעט מול כל אמת מידה אפשרית, והוא עלה הן על מודלים קודמים והן על רופאים", אמר ארג'ון מנראי אשר עומד בראש מעבדת AI בבית הספר לרפואה של הרווארד ואחד ממחברי המחקר הראשיים.

גבולות ברורים ואזהרות

עם זאת, החוקרים ממהרים להדגיש שהמחקר אינו טוען ש-AI מוכן לקבל החלטות של חיים ומוות במציאות הקלינית הנוכחית. במקום זאת, הממצאים מצביעים על "צורך דחוף בניסויים פרוספקטיביים כדי להעריך טכנולוגיות אלה בסביבות טיפול אמיתיות".

המחקר גם מציין מפורשות שהוא בחן רק ביצועים מבוססי טקסט, וכי "מחקרים קיימים מראים שמודלי היסוד הנוכחיים מוגבלים יותר בהיגיון על פני קלטים שאינם טקסט".

אדם רודמן, רופא מ-Beth Israel שגם נמנה כאחד מחברי המחקר, הזהיר שכיום "אין מסגרת פורמלית לאחריות" סביב אבחנות AI, ושמטופלים עדיין "רוצים שבני אדם ידריכו אותם בהחלטות חיים ומוות".

ביקורת מקצועית על הממצאים

קריסטן פנתגאני, רופאה במיון, העלתה ביקורת חשובה על המחקר: הוא השווה בין AI לבין רופאים מומחים למחלות פנימיות, ולא רופאי מיון. "אם אנחנו הולכים להשוות כלי AI ליכולת קלינית של רופאים, עלינו להתחיל בהשוואה לרופאים שבאמת מתמחים באותה התמחות", היא כתבה. פנתגאני גם הדגישה שהמטרה העיקרית של רופא מיון אינה לנחש את האבחנה הסופית, אלא "לקבוע אם בנקודת זמן המיידית יש לך מצב שיכול להרוג אותך".

משמעות לשוק הישראלי

המחקר מגיע בעת שמערכת הבריאות בישראל מתמודדת עם עומס כבד במיונים ומחסור כרוני בכוח אדם רפואי. חברות ישראליות רבות, כמו Zebra Medical Vision ו-Aidoc, כבר מובילות בתחום הדימות הרפואי באמצעות AI. הממצאים עשויים לאותת על הזדמנות משמעותית לפיתוח כלי עזר קליניים מבוססי LLM שיכולים לתמוך ברופאים בתהליך האבחון, במיוחד בשעות שיא ובמצבי לחץ.

יחד עם זאת, הצורך בפיתוח תשתיות רגולטוריות ומסגרות אחריות מתאימות יהווה אתגר משמעותי גם עבור משרד הבריאות הישראלי, שיצטרך להתאים את הפיקוח על טכנולוגיות אלה למציאות המקומית.

מחקר בהרווארד: מודל של OpenAI התעלה על רופאים בדיוק אבחון במיון

מודל AI מול רופאים: תוצאות מפתיעות ממחקר שטח

רוצה להישאר מעודכן ב-AI?

מבחן אמת במציאות קלינית

גבולות ברורים ואזהרות

ביקורת מקצועית על הממצאים

משמעות לשוק הישראלי

שאלות נפוצות