
DeepSeek משיקה מודל V4: 1.6 טריליון פרמטרים במחיר שובר שוק
מעבדת הבינה המלאכותית הסינית DeepSeek השיקה שתי גרסאות של מודל V4, כאשר גרסת ה-Pro מציעה 1.6 טריליון פרמטרים והופכת למודל הקוד-פתוח הגדול בעולם. המודלים החדשים מצמצמים את הפער מול מודלי החזית המובילים של OpenAI וגוגל, תוך הצעת מחירים נמוכים משמעותית' יתרון שעשוי לשנות את משוואת העלויות עבור חברות ישראליות המפתחות מוצרי AI.
מודל הקוד-פתוח הגדול בעולם עם ביצועים מתחרים
DeepSeek, מעבדת הבינה המלאכותית הסינית שזעזעה את שוק ה-AI בתחילת 2025, השיקה את מודל השפה החדש שלה V4 בשתי גרסאות: Flash ו-Pro. גרסת ה-Pro, עם 1.6 טריליון פרמטרים (49 מיליארד פעילים), מהווה את מודל הקוד-פתוח הגדול ביותר שפורסם עד כה - כמעט כפול מגרסת V3.2 הקודמת (671 מיליארד) ומשמעותית גדול ממתחרים כמו Kimi K 2.6 של Moonshot AI (1.1 טריליון) או M1 של MiniMax (456 מיליארד).
רוצה להישאר מעודכן ב-AI?
הירשם לדיוור השבועי שלנו וקבל עדכונים, המלצות על כלים, חדשות ודוחות מיוחדים
שני המודלים בנויים על ארכיטקטורת Mixture-Of-Experts, המאפשרת להפעיל רק חלק מהפרמטרים עבור כל משימה ובכך להוזיל עלויות הסקה. לשניהם חלון הקשר של מליון טוקנים, המאפשר עיבוד קבצי קוד או מסמכים נרחבים.
ביצועים: צמצום הפער אך לא סגירתו המלאה
החברה טוענת שהמודלים החדשים "כמעט סגרו את הפער" מול מודלי החזית המובילים במבחני חשיבה (Reasoning). לפי הנתונים שפרסמה DeepSeek, גרסת ה-Pro-Max מצליחה לעלות על GPT-5.2 של OpenAI ועל Gemini 3.0 Pro במשימות מסוימות, ושני המודלים מגיעים לביצועים "דומים ל-GPT-5.4" במבחני תחרויות קוד.
עם זאת, המודלים נותרים מאחור במבחני ידע מול GPT-5.4 וGemini 3.1 Pro המתקדם של גוגל. המעבדה הסינית מודה בכך בגילוי לב נדיר, וכותבת שמדובר ב"מסלול התפתחות שנמצא כ-3 עד 6 חודשים מאחורי מודלי החזית המתקדמים". בנוסף, בניגוד למתחריה הקנייניים, המודלים החדשים תומכים רק בטקסט, ללא יכולת עיבוד או יצירת אודיו, וידאו ותמונות.
יתרון מחיר דרמטי המשנה את משוואת העלויות
היתרון המשמעותי ביותר של DeepSeek V4 טמון במחיר: מודל ה-Flash עולה 0.14 דולר למיליון טוקני קלט ו-0.28 דולר למיליון טוקני פלט, מתחת לכל המודלים הדומים של OpenAI, אנתרופיק וגוגל. גם ה-Pro, במחירים של 0.145 ו-3.48 דולר בהתאמה, זול משמעותית מ-GPT-5.5, Claude Opus 4.7 ו-Gemini 3.1 Pro.
עבור חברות ישראליות המפתחות מוצרים מבוססי LLM, בין אם בתחום האבטחה, Fintech או Enterprise AI, יתרון המחיר הזה עשוי להוות הזדמנות לחסוך עלויות תפעול משמעותיות. חברות סטארט-אפ מקומיות שעד כה נאלצו לבחור בין ביצועים גבוהים לעלויות נמוכות, יכולות כעת לשקול פתרון שמציע את שניהם, אם כי עם פערי ביצועים מסוימים במשימות ידע.
רקע גיאופוליטי רגיש
ההשקה מגיעה יום לאחר שארצות הברית האשימה את סין בגניבת קניין רוחני של מעבדות AI אמריקאיות בקנה מידה תעשייתי, באמצעות אלפי חשבונות פרוקסי. DeepSeek עצמה הואשמה בעבר על ידי Anthropic ו-OpenAI בביצוע "Distillation" -העתקה של המודלים שלהן.
ההאשמות הללו מעלות שאלות לגבי השימוש במודלים סיניים בארגונים רגישים, במיוחד בישראל שבה שיקולי אבטחת מידע וקשרי החוץ עם ארה"ב הם קריטיים. ארגונים מקומיים שישקלו אימוץ של DeepSeek V4 יצטרכו לשקול היטב את היתרונות הכלכליים מול הסיכונים הגיאופוליטיים והביטחוניים.
