מדד אנתרופיק הכלכלי: AI כבר משנה את פיתוח התוכנה

תפקידים הכוללים קידוד תוכנה מהווים אמנם מגזר קטן יחסית בכלכלה המודרנית, אך בעל השפעה מכרעת. בשנים האחרונות ראינו כיצד תחום זה השתנה באופן דרמטי, עם השקת מערכות AI שיכולות לסייע – ואף להפוך לאוטומטיות – כמויות משמעותיות של עבודת קידוד.

במחקר קודם שלנו במסגרת מדד אנתרופיק הכלכלי, מצאנו שימוש בלתי פרופורציונלי בקלוד בקרב עובדים אמריקאים במקצועות הקשורים למחשבים: כלומר, היו הרבה יותר שיחות עם קלוד בנושאים הקשורים למחשבים ממה שהיינו מצפים ממספר האנשים העובדים בתפקידים רלוונטיים. המצב דומה גם בהקשר החינוכי: לימודי מדעי המחשב – הכוללים כמויות גדולות של קידוד – מראים שימוש גבוה באופן בלתי פרופורציונלי ב-AI.

כדי להבין שינויים אלו בפירוט רב יותר, ערכנו ניתוח של 500,000 אינטראקציות הקשורות לקידוד, שהתרחשו הן ב-Claude.ai (הדרך ה"סטנדרטית" שבה רוב האנשים מקיימים אינטראקציה עם קלוד) והן ב-Claude Code (סוכן הקידוד המומחה החדש שלנו, שיכול לבצע באופן עצמאי שרשראות משימות מורכבות באמצעות מגוון כלים דיגיטליים).

שלוש תובנות מרכזיות מהמחקר

מצאנו שלוש מגמות מפתח עיקריות:

סוכן הקידוד משמש ליותר אוטומציה. 79% מהשיחות ב-Claude Code זוהו כ"אוטומציה" – שבה AI מבצע באופן ישיר משימות – לעומת "העצמה" (augmentation), שבה AI משתף פעולה עם יכולות אנושיות ומשפר אותן (21%). לשם השוואה, רק 49% מהשיחות ב-Claude.ai סווגו כאוטומציה. הדבר עשוי לרמוז כי ככל שסוכני AI יהפכו נפוצים יותר, וככל שמוצרי AI סוכניים נוספים ייבנו, עלינו לצפות ליותר אוטומציה של משימות.
מפתחים משתמשים ב-AI בעיקר לבניית אפליקציות למשתמשי קצה. שפות פיתוח ווב כמו JavaScript ו-HTML היו שפות התכנות הנפוצות ביותר במערך הנתונים שלנו, ומשימות ממשק משתמש (UI) וחווית משתמש (UX) היו בין שימושי הקידוד המובילים. זה מצביע על כך שתפקידים המתמקדים בבניית יישומים פשוטים וממשקי משתמש עשויים להתמודד עם שיבוש מצד מערכות AI מוקדם יותר מאשר אלו המתמקדים אך ורק בעבודת צד השרת (backend).
סטארט-אפים הם המאמצים המוקדמים העיקריים של Claude Code, בעוד ארגונים גדולים מפגרים מאחור. בניתוח מקדמי, הערכנו כי 33% מהשיחות ב-Claude Code שימשו לעבודה הקשורה לסטארט-אפים, לעומת 13% בלבד שזוהו כיישומים רלוונטיים לארגונים גדולים. פער האימוץ הזה מצביע על הבדל בין ארגונים זריזים המשתמשים בכלי AI מתקדמים, לבין ארגונים מסורתיים.

כיצד ניתחנו את האינטראקציות ב-Claude Code וב-Claude.ai?

ניתחנו את 500,000 האינטראקציות הכוללות עם קלוד (מחולקות בין Claude Code ל-Claude.ai) באמצעות כלי הניתוח שלנו השומר על פרטיות, אשר מזקק שיחות משתמשים לתובנות אנונימיות ברמה גבוהה יותר. במחקר זה, השתמשנו בו כדי לזהות את נושא השיחה (לדוגמה: "פיתוח רכיבי UI/UX"), או – כפי שנסביר בהמשך – כדי לסווג שיחה כמתמקדת ב"העצמה" לעומת "אוטומציה".

כיצד מפתחים מקודדים עם קלוד?

בדו"חות הקודמים שלנו של מדד אנתרופיק הכלכלי, הפרדנו בין "אוטומציה", שבה AI מבצע משימות באופן ישיר, לבין "העצמה" (augmentation), שבה AI משתף פעולה עם המשתמש לביצוע משימה. כאן, מצאנו ש-Claude Code הראה שיעורי אוטומציה גבוהים באופן דרמטי – 79% מהשיחות כללו צורה כלשהי של אוטומציה, לעומת 49% ב-Claude.ai.

חילקנו גם את האוטומציה וההעצמה למספר תתי-סוגים (כפי שנדון בעבודתנו הקודמת). דפוסי "לולאת משוב" (Feedback Loop), שבהם קלוד משלים משימות באופן אוטונומי אך בעזרת אימות אנושי (לדוגמה, כאשר המשתמש שולח כל שגיאה בחזרה לקלוד), היו נפוצים כמעט פי שניים ב-Claude Code (35.8% מהאינטראקציות) מאשר ב-Claude.ai (21.3%). שיחות "הנחיה" (Directive), שבהן קלוד השלים משימה עם מינימום אינטראקציה מצד המשתמש, היו גם הן גבוהות יותר ב-Claude Code (43.8%, לעומת 27.5% ב-Claude.ai). כל דפוסי ההעצמה – כולל "למידה", שבה המשתמש רוכש ידע ממודל ה-AI – היו נמוכים משמעותית ב-Claude Code מאשר ב-Claude.ai.

תוצאות אלו ממחישות את ההבדלים בין סוכנים מומחים, הממוקדים בקידוד (במקרה זה, Claude Code), לבין הדרך ה"סטנדרטית" יותר שבה משתמשים מקיימים אינטראקציה עם מודלי שפה גדולים (כלומר, באמצעות ממשק צ'אט בוט כמו Claude.ai). ככל שיושקו יותר מוצרים סוכניים, ייתכן שנראה הבדלים באופן שבו AI משולב בעבודתם של אנשים. לפחות במקרה של קידוד, זה עשוי לכלול יותר אוטומציה של משימות.

זה מעלה שאלות לגבי המידה שבה מפתחים עדיין יהיו מעורבים ככל שהשימוש ב-AI יהפוך נפוץ יותר. חשוב לציין, התוצאות שלנו מראות שגם בתוך האוטומציה, בני אדם עדיין מעורבים לעיתים קרובות: אינטראקציות מסוג "לולאת משוב" עדיין דורשות קלט משתמש (גם אם קלט זה הוא פשוט הדבקת הודעות שגיאה בחזרה לקלוד). אך בשום פנים ואופן לא בטוח שדפוס זה יישמר בעתיד, כאשר מערכות סוכניות בעלות יכולת רבה יותר ידרשו כנראה פחות ופחות קלט משתמש.

מה מפתחים בונים בעזרת קלוד?

בסך הכל, מצאנו שמפתחים משתמשים בקלוד לעיתים קרובות לבניית ממשקי משתמש ורכיבים אינטראקטיביים עבור אתרי אינטרנט ואפליקציות מובייל. אף על פי שאף שפה אחת לא שלטה באופן מוחלט, שפות הפיתוח הממוקדות בעיקר בווב כמו JavaScript ו-TypeScript יחד היוו 31% מכלל השאילתות, ו-HTML ו-CSS (שפות נוספות לקוד מול משתמש) הוסיפו יחד עוד 28%.

שפות פיתוח צד השרת (Backend) (המשמשות ללוגיקה "מאחורי הקלעים", מסדי נתונים ותשתיות, כמו גם פיתוח API ו-AI) היו גם הן מיוצגות: במיוחד Python, עם 14% מהשאילתות. עם זאת, ל-Python יש שימושים כפולים – גם לפיתוח צד שרת וגם לניתוח נתונים. בשילוב עם SQL (שפה נוספת ממוקדת נתונים, המהווה 6% מהשאילתות), שפות אלו כללו ככל הנראה יישומים רבים של מדעי נתונים ואנליטיקה מעבר לפיתוח צד שרת מסורתי.

דפוסים אלו מתרחבים עוד יותר לסוגי משימות הקידוד הנפוצות המערבות את קלוד. שתיים מתוך חמש המשימות המובילות התמקדו בפיתוח אפליקציות מול משתמש: "פיתוח רכיבי UI/UX" ו"פיתוח אפליקציות ווב ומובייל" היוו 12% ו-8% מהשיחות, בהתאמה. משימות כאלה הולכות ומתאימות לתופעה הידועה כ"קידוד וייב" (vibe coding) – שבה מפתחים ברמות ניסיון שונות מתארים את התוצאות הרצויות שלהם בשפה טבעית ונותנים ל-AI לקחת את ההגה על פרטי היישום.

שיחות הקשורות לשימושים גנריים יותר, כגון "ארכיטקטורת תוכנה ותכנון קוד" ו"איתור באגים ואופטימיזציית ביצועים", היו גם הן מיוצגות באופן גבוה הן ב-Claude.ai והן ב-Claude Code.

באופן ספקולטיבי, ממצאים אלו מצביעים על כך שתפקידים המתמקדים בבניית יישומים פשוטים וממשקי משתמש עשויים להתמודד עם שיבוש מוקדם יותר מצד מערכות AI, אם יכולות הולכות וגדלות יגרמו ל"קידוד וייב" לעבור יותר לזרם העבודה המרכזי. ככל ש-AI יטפל יותר ויותר ביצירת רכיבים ובמשימות עיצוב, מפתחים אלו עשויים לעבור לעיסוק בעיצוב ברמה גבוהה יותר ובחווית משתמש.

מי משתמש בקלוד לקידוד?

ניתחנו גם אילו קבוצות מפתחים עשויות להשתמש בקלוד. השתמשנו במערכת הניתוח שלנו כדי לזהות את סוג הפרויקט (לדוגמה, פרויקט אישי מול פרויקט שנעשה עבור סטארט-אפ) שתיאר בצורה הטובה ביותר את האינטראקציות הקשורות לקידוד של המשתמשים. מכיוון שאיננו יודעים את ההקשר בעולם האמיתי שבו נעשה שימוש בתגובות של קלוד, ניתוחים אלו מסתמכים על הסקות לא ודאיות מנתונים חלקיים. לכן, אנו מתייחסים לממצאים אלו כראשוניים יותר מאשר לאלו שתוארו לעיל.

סטארט-אפים נראים כמאמצים המוקדמים העיקריים של Claude Code, ואימוץ מצד ארגונים גדולים מפגר מאחור. עבודת סטארט-אפים היוותה 32.9% מהשיחות ב-Claude Code (כמעט 20% יותר משימושם ב-Claude.ai), בעוד שעבודת ארגונים ייצגה רק 23.8% מהשיחות ב-Claude Code (מעט מתחת לשיעור של 25.9% ב-Claude.ai). חשוב לציין כי נתוני ה-Claude.ai אינם כוללים שימוש ב-Claude For Work (תוכניות צוות וארגונים), מה שמרמז כי ייתכן שנתוני השימוש בארגונים עבור Claude.ai ספציפית נמוכים מהאמת.

בנוסף, שימושים המערבים סטודנטים, אקדמאים, בוני פרויקטים אישיים ומשתמשי הדרכה/למידה מהווים יחד כמחצית מהאינטראקציות בשתי הפלטפורמות. במילים אחרות, אנשים פרטיים – לא רק עסקים – הם מאמצים משמעותיים של כלי סיוע בקידוד.

דפוסי אימוץ אלה משקפים שינויים טכנולוגיים קודמים, שבהם סטארט-אפים משתמשים בכלים חדשים כדי להשיג יתרון תחרותי, בעוד ארגונים מבוססים מתקדמים בזהירות רבה יותר ולרוב מבצעים בדיקות אבטחה מפורטות לפני אימוץ כלים חדשים בכלל הארגון. האופי הכללי של AI יכול להאיץ את הדינמיקה הזו: אם סוכני AI יספקו רווחי פריון משמעותיים, הפער בין מאמצים מוקדמים למאוחרים יכול להתבטא ביתרונות תחרותיים מהותיים.

מגבלות המחקר

הניתוח שלנו מבוסס על שימוש ב-AI בעולם האמיתי – כיצד מפתחים משתמשים בפועל בקלוד בזרימת העבודה שלהם. אף על פי שגישה זו מעניקה לממצאים שלנו רלוונטיות פרקטית, היא מביאה עימה גם מגבלות מהותיות. אלה כוללות:

ניתחנו נתונים מ-Claude.ai ו-Claude Code בלבד. החרגנו שימוש בגרסאות Team, Enterprise ו-API שעלולות להציג דפוסים שונים, במיוחד במסגרות מקצועיות;
הגבול בין אוטומציה להעצמה הופך מטושטש יותר ויותר עם כלים סוכניים כמו Claude Code. לדוגמה, דפוס "לולאת משוב" שונה איכותית מאוטומציה מסורתית, מכיוון שהוא עדיין דורש פיקוח וקלט משתמש. ככל הנראה נצטרך להרחיב את מסגרת האוטומציה/העצמה כדי להתחשב ביכולות סוכניות חדשות;
הקטגוריזציה שלנו לגבי מי משתמש בקלוד לקידוד הסתמכה על הסקה מהקשר מוגבל. כאשר סיווגנו שיחות כעבודת "סטארט-אפ" מול "ארגון" גדול, או פרויקטים "אישיים" מול "אקדמיים", כלי הניתוח שלנו ביצע ניחושים מושכלים בהתבסס על מידע חלקי. לכן, ייתכן שחלק מהסיווגים אינם מדויקים. בנוסף, כללנו אפשרות ל'לא ניתן לסווג', שקלוד בחר בה ב-5% מהשיחות ב-Claude.ai וב-2% מהשיחות ב-Claude Code. החרגנו קטגוריה זו מהניתוח ונרמלנו מחדש את התוצאות;
מערך הנתונים שלנו ככל הנראה לוכד מאמצים מוקדמים. משתמשים אלה עשויים שלא לייצג את אוכלוסיית המפתחים הרחבה יותר, והבחירה העצמית הזו עלולה להטות את דפוסי השימוש לעבר משתמשים מנוסים יותר או הרפתקנים מבחינה טכנית;
משיקולי פרטיות, ניתחנו נתונים רק בתוך חלון שימור ספציפי, מה שעלול לפספס דפוסים מחזוריים בפיתוח תוכנה (כגון מחזורי ספרינט או לוחות זמנים לשחרור);
הייצוגיות של השימוש בקלוד אינה ברורה, ביחס לאימוץ כולל של סיוע קידוד באמצעות AI. מפתחים רבים משתמשים במספר כלי AI מעבר לקלוד, כלומר אנו מציגים רק מבט חלקי על דפוסי המעורבות שלהם ב-AI;
חקרנו רק את מה שמפתחים מפקידים בידי AI – לא כיצד הם משתמשים בסופו של דבר בתוצרי AI בקוד שלהם, איכות הקוד המתקבל, או האם אינטראקציות אלו שיפרו בפועל את הפריון או את איכות הקוד.

מבט לעתיד

AI משנה באופן יסודי את דרכי עבודתם של מפתחים. הניתוח שלנו רומז שזה נכון במיוחד כאשר נעשה שימוש במערכות סוכניות מומחיות כמו Claude Code, הוא חזק במיוחד עבור עבודות פיתוח אפליקציות מול משתמש, ועשוי להעניק יתרונות מיוחדים לסטארט-אפים בניגוד לארגונים עסקיים מבוססים יותר.

הממצאים שלנו מעלים שאלות רבות. האם שכיחותן של "לולאות משוב", שבהן בני אדם עדיין מעורבים בתהליך, תימשך ככל שיכולות ה-AI יתקדמו, או שנראה מעבר לאוטומציה מלאה יותר? ככל שמערכות AI יהיו מסוגלות לבנות חלקי תוכנה בקנה מידה גדול יותר, האם מפתחים יעברו בעיקר לניהול והדרכה של מערכות אלו, במקום לכתוב קוד בעצמם? אילו תפקידי פיתוח תוכנה ישתנו הכי הרבה, ואילו עשויים להיעלם לחלוטין?

כישורי הקידוד הגוברים של AI עשויים להיות בעלי השפעה משמעותית במיוחד על פיתוח AI עצמו. מכיוון שחלק כה גדול ממחקר ופיתוח ה-AI מסתמך על תוכנה, ייתכן שהתקדמות בקידוד בסיוע AI תעזור להאיץ פריצות דרך, וליצור מעגל חיזוק חיובי שיאיץ את התקדמות ה-AI עוד יותר.

במבט כללי, מערכות AI חדשות ביותר. אך במובן יחסי, קידוד הוא בין השימושים המפותחים ביותר של AI בכלכלה. זה מה שהופך אותו לראוי למעקב. אף על פי שאיננו יכולים להניח שהלקחים שאנו מפיקים מפיתוח תוכנה יעברו ישירות לסוגי עיסוקים אחרים, פיתוח תוכנה עשוי להיות אינדיקטור מוביל שיספק לנו מידע שימושי על האופן שבו עיסוקים אחרים עשויים להשתנות עם השקת מודלי AI בעלי יכולת גוברת בעתיד.

מדד אנתרופיק הכלכלי: AI כבר משנה את פיתוח התוכנה