האינטרנט נבנה מחדש: התשתית עוברת לעידן ה-AI Agents

האינטרנט נבנה מחדש: התשתית עוברת לעידן ה-AI Agents

31 במאי 2026
מערכת זירת AI
מקור:זירת AI

AWS השיקה גרסה חדשה של OpenSearch Serverless המותאמת לעומסי AI Agents - מערכת שמסוגלת לעלות ולרדת לאפס בשניות. הצעד משקף שינוי מבני עמוק בתשתית הענן: הטראפיק ברשת עובר ממשתמשים אנושיים למכונות אוטונומיות, ו-Cloudflare מעריכה שטראפיק לא-אנושי יעקוף טראפיק אנושי כבר במחצית הראשונה של 2027.

כשהסוכנים הופכים לצרכני הענן הגדולים ביותר

תשתית הענן תוכננה במשך שנים סביב דפוס אחד: בני אדם שגולשים, לוחצים, מחפשים וצורכים תוכן בקצב יחסית עקבי וצפוי. AI Agents פועלים בצורה שונה לחלוטין. הם יכולים להפעיל בו-זמנית עשרות sub-agents, לשלוח מאות שאילתות למסדי נתונים, לקרוא ל-APIs ולעבד מסמכים - ואז להיעלם תוך שניות.

רוצה להישאר מעודכן ב-AI?

הירשם לדיוור השבועי שלנו וקבל עדכונים, המלצות על כלים, חדשות ודוחות מיוחדים

המציאות הזו אילצה את AWS לבצע שינוי מבני משמעותי. ביום חמישי השיקה החברה את הדור הבא של OpenSearch Serverless - מערכת חיפוש ובסיס נתוני וקטורים מנוהלת במלואה, שמותאמת ספציפית לעומסי עבודה של AI Agents. השינוי הטכני המרכזי: ניתוק ה-compute מה-storage, מה שמאפשר למערכת לעלות בתוך שניות בעת עומס ולרדת לאפס כשאין פעילות.

"הסוכנים עוברים מניסוי לייצור, והם יוצרים דפוסי טראפיק שהתשתית הקודמת פשוט לא תוכננה להם," אמרה Tia White, מנהלת כללית של Amazon OpenSearch Service, כפי שדווח על ידי Rebecca Bellan מ-TechCrunch. "הם מגיעים בפיקים ללא אזהרה, ועוברים למצב שקט ללא הודעה מוקדמת."

הבעיה של חניה ריקה

White השתמשה בהשוואה מחכימה: הגרסה הקודמת של OpenSearch Serverless הייתה דומה לתשלום עבור חניה - גם כשהרכב לא חונה שם. הארכיטקטורה הישנה דרשה להשאיר לפחות instance אחד פעיל בכל עת, מה שהוביל לעלויות idle שאינן מצדיקות את עצמן בסביבות agentic מסוג burst-and-idle. הגרסה החדשה עוברת למודל של "חניה בשעון" - משלמים רק על מה שמשתמשים בפועל.

בהשקה, OpenSearch Serverless יתממשק ישירות עם פלטפורמות פיתוח כמו Vercel ו-Kiro, כך שמפתחים יוכלו לפרוס backends לחיפוש ולוקטורים ל-agents ללא ניהול תשתית ידני.

טראפיק מכונות עוקף בני אדם

השינוי של AWS אינו מבודד. הוא משקף הכרה גוברת בתעשייה כולה שהאינטרנט עצמו עובר שינוי דמוגרפי. Cloudflare מדווחת כי בוטים היוו 31% מכלל טראפיק ה-HTTP בששת החודשים האחרונים, כאשר AI crawlers, מנועי חיפוש ועוזרים וירטואליים היוו כרבע מכלל בקשות הבוטים.

"טראפיק לא-אנושי יעקוף טראפיק אנושי אי שם במחצית הראשונה של 2027," אמרה Lai Yi Ohlsen, מנהלת מוצר בכירה ב-Cloudflare (כפי שפורסם על ידי TechCrunch). השינוי הזה מאיץ ככל שחברות גדולות מגדילות את פריסת ה-agents שלהן.

ב-Google I/O שנערך בשבוע שעבר, הכריזה גוגל על יכולת למשתמשים להאציל משימות ל-AI agents - מחקר רכישות ועד הזמנת נסיעות וגלישה אוטונומית ברשת. אך ההשפעה הגדולה יותר מגיעה מהצד הארגוני: ארגונים מפרסים agents פנימיים ועבור לקוחותיהם בקנה מידה הולך וגדל.

מחזור שמאיץ את עצמו

התגובה לשינוי מגיעה מכל כיוון. Microsoft עדכנה את Azure לטיפול בפיקי AI agents ושיתוף זיכרון בין agents. Cloudflare השיקה בחודש שעבר תשתית המספקת ל-agents סביבות מתמשכות ו-scalability מיידי. Databricks ו-Snowflake מצבות את עצמן כמערכות זיכרון ואחזור לנתוני ארגון.

המשמעות עבור חברות ישראליות היא מעשית: ארגונים שמתכננים פריסת AI agents בסביבת ייצור - ולא רק ניסויי POC - צריכים לבחון מחדש את ארכיטקטורת הענן שלהם. מודלי תמחור שהתבססו על שימוש קבוע ורציף יהיו יקרים ולא יעילים בסביבות agentic. הצורך בתשתית שמסוגלת לעלות ולרדת בשניות, לא בדקות, הפך מיתרון לדרישת בסיס.

חברות ישראליות כמו Wix, monday.com ו-ironSource שמשלבות AI agents בשירותיהן יצטרכו להעריך כיצד דפוסי הטראפיק החדשים משפיעים על עלויות הענן שלהן - ואיזו תשתית תתמוך בצמיחה.

שאלות נפוצות