
המודל החדש של OpenAI משנה את חוקי המשחק
ChatGPT Images 2.0 של OpenAI מסמן קפיצת מדרגה משמעותית ביכולות יצירת תמונות באמצעות בינה מלאכותית. המודל החדש מציג דיוק חסר תקדים ביצירת טקסט בתוך תמונות, תחום שבו מודלים קודמים נכשלו באופן עקבי. היכולת לייצר תפריטים, נכסי שיווק מורכבים וקומיקסים עם טקסט מדויק פותחת אפשרויות חדשות לעסקים ולמעצבים.
שינוי משמעותי ביכולות יצירת תמונות
מודל חדש של OpenAI, ChatGPT Images 2.0, משנה באופן משמעותי את הנורמות המוכרות בתחום יצירת תמונות באמצעות בינה מלאכותית. אם לפני שנתיים בקשה לייצר תפריט למסעדה מקסיקנית הייתה מניבה שמות מזון בלתי קריאים כמו "Enchuita" או "Margartas", היום המודל החדש מסוגל לייצר תפריט שניתן להשתמש בו באופן מידי, מבלי שהלקוחות ישימו לב שמשהו חריג.
רוצה להישאר מעודכן ב-AI?
הירשם לדיוור השבועי שלנו וקבל עדכונים, המלצות על כלים, חדשות ודוחות מיוחדים
השיפור הדרמטי נובע מהיכולת המשופרת של המודל לעבד ולייצר טקסט בתוך תמונות, תחום שהיווה אתגר מרכזי עבור מודלים קודמים. מודלי דיפוזיה מסורתיים התקשו עם משימה זו כיוון שהם עבדו על בסיס שחזור תמונות מתוך רעש, כאשר הטקסט, שמהווה חלק קטן מאוד מהפיקסלים, לא זכה לייצוג נאות בתהליך הלמידה.
יכולות חשיבה ודיוק גבוה
המודל החדש מצויד במה ש-OpenAI מגדירה כ"יכולות חשיבה", המאפשרות לו לחפש באינטרנט, לייצר מספר תמונות מפרומפט אחד, ולבצע בדיקה כפולה של היצירות שלו. יכולות אלו מאפשרות יצירת נכסי שיווק במגוון גדלים, כמו גם רצועות קומיקס מרובות פאנלים עם טקסט מדויק.
לפי ההודעה הרשמית של החברה, "Images 2.0 מביא רמה חסרת תקדים של ספציפיות ונאמנות ליצירת תמונות. הוא לא רק מסוגל להמשיג תמונות מתוחכמות יותר, אלא גם להביא את החזון הזה לחיים באופן אפקטיבי, עם יכולת לעקוב אחר הוראות, לשמר פרטים מבוקשים, ולעבד אלמנטים עדינים שלעתים קרובות שוברים מודלים של יצירת תמונות: טקסט קטן, אייקונוגרפיה, אלמנטי ממשק משתמש, קומפוזיציות צפופות ואילוצים סגנוניים עדינים, הכל ברזולוציה של עד 2K".
תמיכה בשפות שאינן לטיניות
המודל מציג שיפור משמעותי גם בטיפול בשפות שאינן לטיניות, כולל יפנית, קוריאנית, הינדי ובנגלית. זוהי התקדמות חשובה שמרחיבה את הנגישות של הטכנולוגיה לשווקים נוספים ברחבי העולם. בסיס הידע של המודל מסתיים בדצמבר 2025, מה שעשוי להשפיע על דיוק יצירת תמונות הקשורות לאירועים עדכניים.
השלכות על השוק המקומי
השיפור המשמעותי ביכולות יצירת תמונות עם טקסט מדויק יכול לשנות את אופן העבודה של אולפנים לעיצוב גרפי וסוכנויות פרסום בישראל. היכולת לייצר במהירות נכסי שיווק איכותיים במגוון פורמטים, כולל תמיכה בעברית באמצעות יכולות הטקסט המשופרות, עשויה לייעל תהליכי עבודה ולצמצם עלויות.
עם זאת, יש להתייחס בזהירות ליכולות אלו: למרות השיפור המשמעותי, עדיין מומלץ לבצע בדיקת איכות אנושית לפני שימוש מסחרי. כמו-כן, חברות מקומיות צריכות להיות מודעות לשאלות של זכויות יוצרים ומקוריות בשימוש בתוכן שנוצר באמצעות AI.
זמינות ותמחור
המודל זמין החל מהשבוע לכל משתמשי ChatGPT ו-Codex, כאשר משתמשים בתשלום יוכלו לייצר פלטים מתקדמים יותר. OpenAI גם הנגישה את ממשק ה-API של gpt-image-2, עם תמחור שתלוי באיכות וברזולוציה של התוצרים.
היכולות המשופרות מגיעות עם פשרה במהירות - יצירת תמונות מורכבות לוקחת כמה דקות, בניגוד לתשובות מיידיות של שאילתות טקסט רגילות ל-ChatGPT. עם זאת, עבור יצירת תוכן שיווקי או עיצובי איכותי, זמן המתנה זה עדיין נחשב בגדר הסביר.
