
ייל מציעה רישיון קופילפט לבלימת חוסר השקיפות של מודלי AI
חוקרים מהמרכז לאתיקה דיגיטלית של אוניברסיטת ייל פרסמו מסגרת רישוי חדשה בשם CCAI, שתחייב חברות AI המשתמשות בקוד קוד-פתוח לחשוף את ארכיטקטורת המודל ונתוני האימון. ההצעה מכוונת לעצור את תופעת ה"שקיפות הפיקטיבית" ולאפשר למפתחים שליטה ממשית על אופן השימוש בקוד שלהם.
רישיון חדש של ייל רוצה לחייב את חברות ה-AI להיות שקופות באמת
קהילת הקוד-הפתוח (FOSS) נמצאת זה שנים בעמדת נחיתות מול ענקיות ה-AI: חברות כמו Meta ו-Google מאמנות מודלים על קוד שנכתב בידי אלפי מתנדבים ומפתחים, אך מחזירות לציבור מודלים שקופים רק חלקית. הארכיטקטורה נגישה, אך נתוני האימון, תהליכי הכוונון העדין ומסמכי הבטיחות נשארים לרוב סגורים. כעת מציעים חוקרי אוניברסיטת ייל מסגרת רישוי שיכולה לשנות את מאזן הכוחות הזה.
רוצה להישאר מעודכן ב-AI?
הירשם לדיוור השבועי שלנו וקבל עדכונים, המלצות על כלים, חדשות ודוחות מיוחדים
המחקר, שפורסם בכתב העת International Journal of Law and Information Technology, מציע מה שהחוקרים מכנים Contextual Copyleft AI License - בקיצור CCAI. הרעיון לוקח מושג מוכר מעולם התוכנה - רישיון copyleft, המחייב כל יצירה נגזרת להישאר פתוחה בדיוק כמו המקור - ומרחיב אותו למודלי AI גנרטיביים.
לפי ההצעה, כל חברה שמאמנת מודל AI על קוד-פתוח תחויב לפרסם את ארכיטקטורת המודל, נתוני האימון ותהליך הפיתוח במלואם. אי-עמידה בתנאים תאסור שימוש בחומרים אלו.
"ניתוח שלנו הראה שהרחבת מושג ה-copyleft ל-AI גנרטיבי עשויה לתת למפתחי קוד-פתוח שליטה ממשית על האופן שבו חברות AI משתמשות בקוד שלהם", אמר גרנט שנקלין, הכותב הראשי של המחקר ועמית מחקר ב-DEC. "חשוב מכך, זה יתמרץ יצירת קהילה שבונה כלי AI בהתאם לערכי תנועת הקוד-הפתוח."
קלאודיו נובלי, מחבר שותף וחוקר ב-DEC, הצביע על הפער הקיים: "חברות ה-AI הרוויחו מאוד מהשימוש בקוד-פתוח, אך המודלים שיצרו אינם באמת פתוחים. ייתכן שהם שקופים לגבי היבטים מסוימים, אך רכיבים מרכזיים נשארים סגורים."
האתגר המשפטי: fair use
המחקר אינו מתעלם מהמורכבות המשפטית. יישום CCAI תלוי בשאלה קריטית: האם אימון מודלי AI על קוד מוגן זכויות יוצרים מהווה "שימוש הוגן" (fair use) לפי החוק האמריקאי. עדיין אין הסכמה שיפוטית ברורה בנושא, וכמה תיקים משפטיים מרכזיים תלויים ועומדים בבתי המשפט האמריקאיים. החוקרים טוענים שבתרחיש שבו אימון AI אינו מוגדר כ-fair use, הרישיון יהיה ניתן לאכיפה מלאה.
לצד זאת, הם מזהירים מפני סיכוני ה-AI הגנרטיבי הפתוח: שלא כמו תוכנה רגילה, מודלים אלו עלולים לשמש ישירות ליצירת תוכן מזיק, הטעיה ופישינג מתוחכם. הפתרון שהם מציעים הוא שילוב רישוי ה-CCAI עם רגולציה ממשלתית - למשל, מסגרות דומות לחוק ה-AI האירופאי.
רלוונטיות לשוק הישראלי
לישראל יש עניין ישיר בדיון הזה. עשרות סטארטאפים ישראלים בתחום ה-AI - בין אם ב-vertical software ובין אם בכלי פיתוח - מסתמכים על מודלים ופריימוורקים פתוחים כמו LLaMA, Mistral ו-Hugging Face. אם מסגרת כמו CCAI תאומץ ברמה הבינלאומית, היא תשפיע על עלויות הפיתוח, על חשיפה משפטית, ועל מידת הגמישות העסקית שחברות אלו נהנות ממנה כיום.
במקביל, עבור חברות ישראליות שבונות מוצרים על בסיס מודלים פתוחים, שקיפות גדולה יותר של נתוני האימון עשויה לאפשר ביקורת טובה יותר על הטיות במודל - שאלה קריטית במיוחד ביישומים רגישים כמו רפואה, ביטחון ופיננסים.
המחקר עוד לא הפך לרגולציה, ויש לו מתנגדים צפויים בקרב חברות הטכנולוגיה הגדולות. אך הוא מניח תשתית תיאורטית ומשפטית שיכולה להשפיע על הדיון הציבורי והחקיקתי בשנים הקרובות.
