מציגים את Anthropic Interviewer: כך רואים 1,250 אנשי מקצוע את עבודתם עם AI

מציגים את Anthropic Interviewer: מה למדו ב-Anthropic מ-1,250 אנשי מקצוע על עבודה עם AI

מיליוני אנשים משתמשים כיום בבינה מלאכותית (AI) מדי יום. כאחת החברות המובילות בפיתוח מערכות AI, אנתרופיק (Anthropic) שואפת להבין כיצד ומדוע אנשים משתמשים בטכנולוגיה זו, וכיצד היא משפיעה עליהם. הבנה זו חיונית לא רק לפיתוח מוצרים טובים יותר, אלא גם לשם התמודדות עם אחת השאלות הסוציולוגיות הגדולות של זמננו – השתלבות ה-AI בחיינו.

בעבר, אנתרופיק פיתחה כלי שאיפשר לה לנתח דפוסי שימוש ב-AI תוך שמירה על פרטיות המשתמשים, ובאמצעותו אף ניתחה את דפוסי השימוש המשתנים ב-AI ברחבי הכלכלה. אולם, כלי זה אפשר להבין רק את המתרחש בתוך השיחות עם קלוד. מה קורה לאחר מכן? כיצד אנשים באמת משתמשים בפלטים של קלוד? איך הם מרגישים לגבי זה? וכיצד הם מדמיינים את תפקיד ה-AI בעתידם? כדי לקבל תמונה מקיפה של תפקיד ה-AI המשתנה בחיי אנשים, וכדי למקם את האדם במרכז פיתוח המודלים, אנו צריכים לשאול אנשים באופן ישיר.

פרויקט כזה היה דורש מאיתנו לנהל מאות רבות של ראיונות. כאן, גייסנו את ה-AI לעזרתנו. בנינו כלי ראיונות בשם Anthropic Interviewer. מופעל על ידי קלוד, Anthropic Interviewer מנהל ראיונות מפורטים באופן אוטומטי ובקנה מידה חסר תקדים, ומזין את תוצאותיו חזרה לחוקרים אנושיים לצורך ניתוח. זהו צעד חדש בהבנת הצרכים והרצונות של המשתמשים שלנו, וכן באיסוף נתונים לניתוח ההשפעות החברתיות והכלכליות של AI.

כדי לבחון את Anthropic Interviewer, השתמשנו בו לניהול 1,250 ראיונות עם אנשי מקצוע – כוח העבודה הכללי (N=1,000), מדענים (N=125) ואמנים (N=125) – בנוגע לעמדותיהם על AI. אנו משחררים לציבור את כל נתוני הראיונות מהבדיקה הראשונית הזו (בהסכמת המשתתפים) כדי לאפשר לחוקרים לחקור אותם; הניתוח שלנו מפורט להלן. בקצרה, הנה כמה דוגמאות למה שמצאנו:

במדגם שלנו, אנשים אופטימיים לגבי תפקיד ה-AI בעבודתם. סנטימנטים חיוביים אפיינו את רוב הנושאים שנדונו. עם זאת, מספר קטן של נושאים, כמו שילוב בחינוך, החלפת אמנים וחששות ביטחוניים, לוו בתחזיות פסימיות יותר.
אנשים מכוח העבודה הכללי רוצים לשמר משימות המגדירות את זהותם המקצועית, תוך האצלת עבודה שגרתית ל-AI. הם חוזים עתיד שבו משימות שגרתיות עוברות אוטומציה, ותפקידם עובר לפיקוח על מערכות AI.
אמנים משתמשים ב-AI כדי להגביר את הפרודוקטיביות שלהם למרות שיפוט עמיתים וחרדה לגבי העתיד. הם מתמודדים הן עם הסטיגמה המיידית של שימוש ב-AI בקהילות יצירתיות והן עם חששות עמוקים יותר לגבי עקירה כלכלית ושחיקה של הזהות היצירתית האנושית.
מדענים רוצים שותפות עם AI אך עדיין אינם יכולים לסמוך עליו למחקר ליבה. מדענים הביעו באופן אחיד רצון ל-AI שיכול לייצר השערות ולתכנן ניסויים. אולם, כיום, הם הגבילו את השימוש בפועל למשימות אחרות כמו כתיבת כתבי יד או ניפוי באגים בקוד ניתוח.

מתודולוגיה

בבדיקה ראשונית זו נבדק כיצד עובדים משלבים AI בפרקטיקה המקצועית שלהם וכיצד הם מרגישים לגבי תפקידו בעתידם. ערכנו ראיונות כדי לייצר נתונים איכותניים, והשלמנו אותם בנתונים כמותיים מסקרים שבהם המשתתפים ענו על שאלות בנוגע לרקע ההתנהגותי והתעסוקתי שלהם. בנוסף, השתמשנו בכלי ניתוח AI נפרד שקרא את תמלילי הראיונות וקיבץ יחד נושאים מרכזיים שעלו מנתונים לא מובנים – למשל, באחוז המשתתפים שהזכירו נושא ספציפי או הביעו דעה ספציפית בראיון שלהם.

משתתפים

השתמשנו ב-Anthropic Interviewer כדי לנהל ראיונות עם 1,250 אנשי מקצוע. הכלי נועד לראיין משתמשי Claude.ai כלליים, אך עבור בדיקה ראשונית זו, חיפשנו משתתפים העובדים במגוון מקצועות וגייסנו אותם באמצעות פלטפורמות עובדי קהל (לכל המשתתפים הייתה עבודה עיקרית שאינה עבודת קהל).

1,000 מהמשתתפים שלנו גויסו ממדגם כללי של עיסוקים (כלומר, לא בחרנו משתתפים מעבודות ספציפיות). בקבוצה זו, תתי-הקבוצות הגדולות ביותר הגיעו מהוראה (17%), מקצועות מחשבים ומתמטיקה (16%), ואמנות, עיצוב, בידור ומדיה (14%).

גייסנו גם שני מדגמים מומחים של 125 משתתפים כל אחד. הראשון היה ממקצועות יצירתיים: בעיקר סופרים וכותבים (48% מהמדגם), ואמנים חזותיים (21%), עם קבוצות קטנות יותר של יוצרי סרטים, מעצבים, מוזיקאים ועובדי יצירה. השני היה מתחום המדע, וכלל פיזיקאים (9%), כימאים (9%), מהנדסים כימיים (7%) ומדעני נתונים (6%), עם ייצוג מ-50+ דיסציפלינות מדעיות נפרדות נוספות.

בחרנו להוסיף את שתי תתי-קבוצות המומחים הללו מכיוון שהן מייצגות תחומים מקצועיים שבהם תפקיד ה-AI נותר שנוי במחלוקת ומתפתח במהירות. שיערנו כי אמנים ומדענים יחשפו דפוסי אימוץ AI וחששות מקצועיים מובהקים.

כל המשתתפים נתנו הסכמה מדעת לניתוח נתוני הראיונות שלהם למטרות מחקר ולשחרור תמלילי הראיונות לציבור.

כיצד Anthropic Interviewer פועל

Anthropic Interviewer פועל בשלושה שלבים: תכנון, ראיון וניתוח. להלן תיאור כל אחד מהם:

תכנון

בשלב זה, Anthropic Interviewer יוצר תבנית ראיון המאפשרת לו להתמקד באותן שאלות מחקר כלליות על פני מאות או אלפי ראיונות, אך עדיין גמישה מספיק כדי להתאים לווריאציות וסטיות שעשויות להתרחש בראיונות פרטניים.

פיתחנו System Prompt – סט הוראות כללי לאופן שבו מודל ה-AI אמור לעבוד – כדי להעניק ל-Anthropic Interviewer את המתודולוגיה שלו. כאן כללנו השערות לגבי כל מדגם, כמו גם שיטות עבודה מומלצות ליצירת תוכנית ראיון (זה נקבע בשיתוף פעולה עם צוות מחקר המשתמשים שלנו).

לאחר הטמעת ה-System Prompt, Anthropic Interviewer השתמש בידע שלו על מטרת המחקר שלנו (ראו סעיף למטה) כדי ליצור שאלות ספציפיות וזרימת שיחה מתוכננת. לאחר מכן התקיים שלב סקירה שבו חוקרים אנושיים שיתפו פעולה עם Anthropic Interviewer כדי לבצע את כל העריכות הנדרשות לסיום התוכנית.

ראיון

לאחר מכן, Anthropic Interviewer ניהל ראיונות אדפטיביים בזמן אמת בהתאם לתוכנית הראיון שלו. בשלב זה, כללנו System Prompt כדי להנחות את Anthropic Interviewer כיצד להשתמש בשיטות עבודה מומלצות לראיונות.

הראיונות שנוהלו על ידי Anthropic Interviewer הופיעו ב-Claude.ai ונמשכו כ-10-15 דקות עם כל משתתף.

ניתוח

לאחר השלמת הראיונות, חוקר אנושי שיתף פעולה עם Anthropic Interviewer כדי לנתח את התמלילים. שלב הניתוח של Anthropic Interviewer מקבל כקלט את תוכנית הראיון הראשונית ומוציא תשובות לשאלות המחקר יחד עם ציטוטים ממחישים. בשלב זה, השתמשנו גם בכלי הניתוח האוטומטי שלנו לזיהוי נושאים מתפתחים ולכימות שכיחותם בקרב המשתתפים.

מטרות המחקר

כפי שתואר לעיל, Anthropic Interviewer הופקד על מטרות המחקר באמצעות ה-System Prompt שלו, וניהל את ראיונותיו באופן שיענה עליהן. יש לציין כי במחקר ראשוני זה, כוונתנו העיקרית הייתה לבצע בדיקה מעשית של Anthropic Interviewer; עם זאת, המטרות שלהלן סיפקו נתונים מעניינים אותם אנו מנתחים להלן.

אלו היו מטרות המחקר העיקריות עבור כל תת-מדגם:

כוח העבודה הכללי. "להבין כיצד אנשים משלבים כלי AI בזרימות העבודה המקצועיות שלהם, ולחקור דפוסי שימוש, העדפות משימות וסגנונות אינטראקציה כדי לקבל תובנות לגבי הקשר המתפתח בין בני אדם ל-AI בהקשרים של מקום העבודה."
אמנים. "להבין כיצד אנשי מקצוע יצירתיים משלבים כיום AI בתהליכי היצירה שלהם, את חוויותיהם עם השפעת ה-AI על עבודתם, ואת חזונם לגבי הקשר העתידי בין AI ליצירתיות אנושית."
מדענים. "להבין כיצד מערכות AI משתלבות בזרימות העבודה המחקריות היומיומיות של מדענים, ולבחון את דפוסי השימוש הנוכחיים שלהם, הערך הנתפס, רמות האמון והחסמים לאימוץ על פני שלבים שונים של התהליך המדעי."

ממצאים

להלן נדון במה שגילינו בראיונות שלנו ונספק נתונים כמותיים מהסקר שלנו ומהניתוח התמטי.

השפעת ה-AI על כוח העבודה הכללי

בסך הכל, חברי המדגם הכללי שלנו של אנשי מקצוע תיארו את ה-AI כמעודד פרודוקטיביות. בסקר, 86% מאנשי המקצוע דיווחו ש-AI חוסך להם זמן, ו-65% אמרו שהם מרוצים מהתפקיד ש-AI ממלא בעבודתם.

נושא אחד שעלה הוא כיצד דינמיקת מקום העבודה משפיעה על אימוץ AI. 69% מאנשי המקצוע הזכירו את הסטיגמה החברתית שיכולה להתלוות לשימוש בכלי AI בעבודה – בודק עובדות אחד סיפר ל-Anthropic Interviewer: "עמית אמר לאחרונה שהוא שונא AI ואני פשוט לא אמרתי כלום. אני לא מגלה לאף אחד את התהליך שלי כי אני יודע איך הרבה אנשים מרגישים לגבי AI."

בעוד ש-41% מהמרואיינים אמרו שהם מרגישים בטוחים בעבודתם ומאמינים שכישורי אנוש אינם ניתנים להחלפה, 55% הביעו חרדה לגבי השפעת ה-AI על עתידם. 25% מהקבוצה שהביעה חרדה אמרו שהם מציבים גבולות לשימוש ב-AI (לדוגמה, מחנך שתמיד יוצר תוכניות שיעור בעצמו), בעוד ש-25% התאימו את תפקידי מקום העבודה שלהם, לקחו על עצמם אחריות נוספת או עסקו במשימות מיוחדות יותר.

הגישות לשימוש ב-AI היו מגוונות מאוד. מנהל איכות נתונים אחד בחר במכוון בלמידה על פני אוטומציה: "אני מנסה לחשוב על זה כמו ללמוד שפה זרה – שימוש באפליקציית תרגום לא ילמד אותך כלום, אבל מורה פרטי שיכול לענות על שאלות ולהתאים לצרכים שלך באמת יעזור." משווק נקט בגישה גמישה: "אני מנסה לגוון תוך שמירה על נישה חזקה." מתורגמן אחד כבר התכונן לעזוב את התחום לחלוטין: "אני מאמין ש-AI יחליף בסופו של דבר את רוב המתורגמנים... אז אני כבר מתכונן למעבר קריירה, אולי על ידי השגת תעודה וכניסה למקצוע אחר." יש לציין כי רק 8% מאנשי המקצוע הביעו חרדה ללא תוכנית טיפול ברורה כלשהי.

סווגנו גם את עוצמת הרגשות השונים שהוצגו בראיונות של אנשי מקצוע. מקצועות שונים הציגו פרופילים רגשיים אחידים באופן יוצא דופן, שאופיינו ברמות גבוהות של שביעות רצון. עם זאת, הדבר לווה בתסכול, מה שמרמז שאנשי מקצוע מוצאים את ה-AI שימושי תוך התמודדות עם אתגרי יישום משמעותיים.

הגברה מול אוטומציה

בניתוח קודם, סווגנו את השימושים ב-AI ל"הגברה" (augmentation, שבה ה-AI משתף פעולה עם משתמש לביצוע משימה), או "אוטומציה" (automation, שבה ה-AI מבצע משימות באופן ישיר). בנתוני Anthropic Interviewer, 65% מהמשתתפים תיארו את תפקידו העיקרי של ה-AI כהגברה; 35% תיארו אותו כאוטומציה. יש לציין כי נתון זה שונה מהניתוח האחרון שלנו לגבי אופן השימוש של אנשים בקלוד, שהראה חלוקה הרבה יותר שווה: 47% מהמשימות כללו הגברה ו-49% אוטומציה. קיימים מספר הסברים פוטנציאליים להבדל זה:

ייתכנו הבדלים במדגם בין מרואייני Anthropic Interviewer לבין המשתמשים במחקר הקודם שלנו;
שיחות של אנשים בקלוד עשויות להיראות יותר אוטומטיות ממה שהן באמת – משתמשים עשויים לחדד או להתאים את הפלטים של קלוד לאחר שהצ'אט מסתיים;
המשתתפים עשויים להשתמש בספקי AI שונים למשימות שונות;
סגנונות אינטראקציה שדווחו עצמית עשויים לסטות משימוש בעולם האמיתי;
אנשי מקצוע עשויים לתפוס את השימוש שלהם ב-AI כשיתופי יותר ממה שדפוסי השיחה שלהם בקלוד מצביעים.

אנשי מקצוע חזו עתיד עם הגברה ואוטומציה כאחד – אוטומציה של משימות שגרתיות וניהוליות עם שמירה על פיקוח אנושי. 48% מהמרואיינים שקלו מעבר לקריירה לתפקידים המתמקדים בניהול ופיקוח על מערכות AI במקום ביצוע עבודה טכנית ישירה.

...אם אשתמש ב-AI ואשפר את כישוריי איתו, זה יכול לחסוך לי כל כך הרבה זמן בצד הניהולי, מה שיפנה אותי להיות עם האנשים.

כומר אמר כי "...אם אשתמש ב-AI ואשפר את כישוריי איתו, זה יכול לחסוך לי כל כך הרבה זמן בצד הניהולי, מה שיפנה אותי להיות עם האנשים". הוא גם הדגיש את חשיבות "גבולות טובים", והימנעות מלהפוך ל"תלוי ב-AI עד כדי כך שלא אוכל לחיות בלעדיו או לעשות את מה שאני נקרא לעשות".

מומחה תקשורת אמר: "אני מאמין שרוב העבודה שלי כנראה תיכף תיתפס על ידי AI. אני חושב שתפקידי בסופו של דבר יתמקד בתימצות, פיקוח, אימון ובקרת איכות של המודלים במקום לבצע את העבודה בעצמי." אנשי מקצוע שנאסר עליהם כיום להשתמש ב-AI בעבודה – למשל, עורכי דין, רואי חשבון ועובדי בריאות – צפו שינויים במדיניות שיאפשרו להם לאוטומציה של משימות רבות בעתיד.

השפעת ה-AI על מקצועות יצירתיים

מדגם אנשי המקצוע היצירתיים שלנו דיווח גם הוא שה-AI הגביר את הפרודוקטיביות שלהם. 97% דיווחו ש-AI חסך להם זמן, ו-68% אמרו שהוא הגדיל את איכות עבודתם. סופר אחד הסביר: "אני מרגיש שאני יכול לכתוב מהר יותר כי המחקר אינו כל כך מרתיע," בעוד שכותב תוכן לאינטרנט דיווח כי "עברתי מלייצר 2,000 מילים של תוכן מלוטש ומקצועי ליותר מ-5,000 מילים מדי יום." צלם אחד ציין כיצד AI טיפל במשימות עריכה שגרתיות – והפחית את זמן האספקה מ-"12 שבועות לכשלושה" – מה שאיפשר לו "לבצע עריכות ושינויים מכוונים שאולי החמצתי קודם או שלא היה לי זמן אליהם."

בדומה למדגם הכללי, 70% מהאמנים הזכירו ניסיון לנהל את שיפוט העמיתים סביב השימוש ב-AI. אמן מפות אחד אמר: "אני לא רוצה שהמותג שלי ותדמית העסק שלי יהיו קשורים כל כך ל-AI ולסטיגמה שאופפת אותו."

תחומים מסוימים של דיבוב למעשה מתו עקב עליית ה-AI.

חרדה כלכלית הופיעה לאורך כל הראיונות של האמנים. שחקן קול אחד הצהיר כי: "תחומים מסוימים של דיבוב למעשה מתו עקב עליית ה-AI, כמו דיבוב תעשייתי." מלחין אחד חשש מפלטפורמות שעלולות "למנף טכנולוגיית AI יחד עם ספריות הפרסום שלהן [כדי] לייצר אינסוף מוזיקה חדשה," ולהציף שווקים בחלופות זולות למוזיקה מיוצרת אנושית. אמן אחר הביע חששות דומים: "במציאות, אני חושש שאצטרך להמשיך להשתמש ב-AI גנרטיבי ואפילו להתחיל למכור תוכן שנוצר כדי לעמוד בקצב בשוק ושאוכל להתפרנס." מנהל קריאייטיב אמר: "אני מבין היטב שהרווח שלי הוא הפסד של אמן אחר. צלם המוצרים הזה שנהגתי לשלם לו 2,000 דולר ליום כבר לא מקבל את העסק שלי." (יש לציין כי קלוד אינו מייצר תמונות, סרטונים או מוזיקה – חששות המשתתפים הם, אם כן, לגבי AI באופן כללי, ולא ספציפיים לקלוד).

כל 125 המשתתפים הזכירו שהם רוצים להישאר בשליטה על התוצרים היצירתיים שלהם. עם זאת, גבול זה התגלה כלא יציב בפועל: משתתפים רבים הכירו ברגעים שבהם ה-AI הוביל החלטות יצירתיות. אמן אחד הודה: "ה-AI מוביל חלק ניכר מהקונספטים; אני פשוט מנסה להדריך אותו... 60% AI, 40% רעיונות שלי". מוזיקאי אחד אמר: "אני שונא להודות בכך, אבל התוסף שולט ברוב המקרים בשימוש בו."

דיסציפלינות הציגו פרופילים רגשיים מנוגדים: מפתחי משחקים ואמנים חזותיים דיווחו על שביעות רצון גבוהה, שבצורה פרדוקסלית לוותה בחרדה מוגברת. מעצבים הראו דפוס הפוך שנשלט על ידי תסכול עם שביעות רצון נמוכה במיוחד. בכל הדיסציפלינות, האמון נותר נמוך באופן עקבי, מה שמרמז על אי ודאות משותפת לגבי ההשלכות ארוכות הטווח של AI על עבודה יצירתית. המתח בין שביעות רצון ודאגה עשוי להדגיש את מצבם של אנשי מקצוע יצירתיים המאמצים בו זמנית כלי AI תוך התמודדות עם חששות לגבי עתיד היצירתיות האנושית. הפיזור הרחב על פני הספקטרום הרגשי אישר שמקצועות יצירתיים שונים חוו שילוב AI דרך עדשות רגשיות שונות מאוד.

השפעת ה-AI על עבודה מדעית

הראיונות שלנו עם חוקרים בכימיה, פיזיקה, ביולוגיה ותחומים חישוביים זיהו שבמקרים רבים, AI עדיין לא יכול היה לטפל באלמנטים מרכזיים במחקרם כמו יצירת השערות וניסויים. מדענים דיווחו בעיקר על שימוש ב-AI למשימות אחרות כמו סקירת ספרות, קידוד וכתיבה. זהו תחום שבו חברות AI, כולל אנתרופיק, פועלות לשיפור הכלים והיכולות שלהן.

חששות לגבי אמון ואמינות היוו את המחסום העיקרי ב-79% מהראיונות; המגבלות הטכניות של מערכות ה-AI הנוכחיות הופיעו ב-27% מהראיונות. חוקר אבטחת מידע אחד ציין: "אם אני צריך לבדוק שוב ולאשר כל פרט ופרט שהסוכן [ה-AI] נותן לי כדי לוודא שאין טעויות, זה די מפספס את מטרת הסוכן לבצע את העבודה הזו מלכתחילה." מתמטיקאי אחד הדהד את התסכול הזה: "אחרי שאני צריך להשקיע את הזמן בווידוא הפלט של ה-AI, זה בעצם מסתיים באותו [כמות] זמן." מהנדס כימי ציין חששות לגבי חנפנות, והסביר כי: "AI נוטה לחנף לרגישויות [המשתמש] ולשנות את תשובתו בהתאם לאופן ניסוח השאלה. חוסר העקביות נוטה לגרום לי להיות סקפטי לגבי תגובת ה-AI."

רוב התחומים המדעיים דיווחו על שביעות רצון גבוהה, אך עם דפוסי תסכול שונים: פיזיקאים ומדעני נתונים הראו תסכול גבוה יותר, בעוד שמהנדסים כימיים ומכניים הציגו תסכול מינימלי. הדבר עשוי לשקף הבדלים באופן שבו תחומים חישוביים לעומת ניסיוניים מנסים לשלב AI בזרימות עבודה מחקריות ליבה: מדענים שעבודתם דורשת אינטראקציה בעולם האמיתי ייתכן שעדיין לא מנסים להשתמש ב-AI לניסויי המדע הליבתיים שלהם. האמון נשאר נמוך יחסית בכל התחומים, מה שמצביע על חששות אמינות נרחבים ללא קשר לדיסציפלינה. בניגוד לאנשי מקצוע יצירתיים המביעים רמות גבוהות של דאגה לגבי השפעת ה-AI, מדענים מראים רמות דאגה נמוכות יחסית. הדבר עולה בקנה אחד עם תסכוליהם המוצהרים לגבי יכולתו של ה-AI להשלים משימות יצירת השערות וניסויים.

מדענים, באופן כללי, לא חששו מעקירת עבודה עקב AI. חלקם הצביעו על ידע סמוי העמיד בפני דיגיטציה, כשמיקרוביולוג אחד הסביר: "עבדתי עם זן חיידקים אחד שבו היית צריך ליזום צעדים שונים כאשר התאים הגיעו לצבעים ספציפיים. את הבדלי הצבע צריך לראות כדי להבין אותם ו[ההוראות] לעיתים ררו קרובות אינן כתובות בשום מקום." אחרים הדגישו את האופי האנושי המהותי של קבלת החלטות מחקריות, כאשר מהנדס ביו-רפואי אחד הצהיר: "ניסויים ומחקר הם גם... במהותם תלויים בי," וציין כי "חלקים מסוימים של תהליך המחקר אינם, למרבה הצער, תואמים ל-AI למרות שהם החלק שיהיה הכי נוח לאוטומציה, כמו עריכת ניסויים."

אילוצים חיצוניים יצרו גם חסמים להחלפת AI – חוקרים בסביבות מסווגות ציינו כי "יש הרבה 'עשה ואל תעשה' עם המון תהליכים מוכווני אבטחה שיש להטמיע לפני שהארגון יוכל לאפשר לנו להשתמש במסגרות סוכניות, ואפילו במודלי שפה גדולים (LLMs) לדוגמה." מהנדס מכונות המנהל משאבים מוגבלים הסביר כי, למרות ש-"AI טוב ביצירת תכנון ניסויים," במציאות "רוב המחקר שלי מוגבל בתקציב/זמן/דוגמאות ולכן התכנון ה'אידיאלי' אינו תמיד בר-קיימא." עם זאת, אילוצי ציות רגולטוריים, חששות מפני ניוון כישורים וחסמי עלות הועלו כל אחד בפחות מ-10% מהראיונות.

הייתי רוצה AI שיוכל להרגיש כשותף מחקר יקר ערך... שיוכל להביא משהו חדש לשולחן.

91% מהמדענים הביעו רצון לסיוע נוסף של AI במחקרם, גם אם לא הרגישו שמוצרי היום עומדים בדרישות. בערך שליש חזו סיוע בעיקר במשימות כתיבה, אך הרוב רצו תמיכה בכל המחקר שלהם: ביקורת על תכנון ניסויים, גישה למאגרי מידע מדעיים וביצוע ניתוחים. רצון נפוץ היה ל-AI שיכול לייצר רעיונות מדעיים חדשים. מדען רפואי אחד אמר: "הלוואי שה-AI יוכל... לעזור ליצור או לתמוך בהשערות או לחפש אינטראקציות/קשרים חדשניים שאינם ברורים מיד לבני אדם". אחר הדהד את הסנטימנט הזה, באומרו: "הייתי רוצה AI שיוכל להרגיש כשותף מחקר יקר ערך... שיוכל להביא משהו חדש לשולחן."

מבט קדימה

בדיקה ראשונית זו הראתה כי Anthropic Interviewer מבטיח בקנה מידה רחב – הצלחנו לערוך 1,250 ראיונות עם מגוון אנשי מקצוע כדי להבין את תחושותיהם לגבי AI בעבודה. מחקר עם כל כך הרבה משתתפים היה יקר וגוזל זמן רב עם שיטות ראיון "ידניות" מסורתיות.

אך חשיבותו של Anthropic Interviewer חורגת מעבר למתודולוגיה: הוא משנה באופן מהותי את השאלות שאנו יכולים לשאול ולענות עליהן לגבי תפקיד ה-AI בחברה, וכיצד ראיונות על כל נושא יכולים להתקיים בקנה מידה חדש זה. המאמץ שלנו לערוך מחקר משמעותי בקנה מידה רחב עם Anthropic Interviewer רק מתחיל. בעבר, הייתה לנו רק תובנה לגבי האופן שבו אנשים השתמשו בקלוד בתוך חלון הצ'אט. לא ידענו כיצד אנשים מרגישים לגבי שימוש ב-AI, מה הם רוצים לשנות באינטראקציות שלהם עם הטכנולוגיה, או כיצד הם חוזים את תפקידו העתידי של ה-AI בחייהם.

הממצאים מסקר ראשוני זה מספקים לנו תובנות חדשות, מעבר לעבודתנו על מדד כלכלי, כדי להבין כיצד אנשים משתמשים ב-AI במקום עבודתם. אנו משתפים ממצאים ראשוניים אלה לדיון עם המועצה המייעצת הכלכלית שלנו והוועדה המייעצת להשכלה גבוהה. ככל שנמשיך במחקר זה, נשתף באופן ציבורי את תוצאות הפיילוט שלנו, יחד עם האופן שבו הממצאים ישפיעו על עבודתנו העתידית.

Anthropic Interviewer הוא הצעד האחרון שלנו למקם קולות אנושיים במרכז השיחה על פיתוח מודלי AI – משהו שהתחלנו עם עבודתנו על AI חוקתי קולקטיבי, שאסף פרספקטיבות ציבוריות לעיצוב התנהגותו של קלוד. שיחות אלו יכולות לעזור לנו לשפר את אופיו ותהליך האימון של קלוד עצמו, וכן ליידע מדיניות עתידית שאנתרופיק מקדמת ומאמצת. להלן כמה מהצעדים המעשיים שנקטנו כדי לחקור שותפויות עם קהילות ספציפיות, המסייעות לנו לפתח AI המבוסס על מומחיותן:

אמנים. אנו תומכים בפיתוח תערוכות, סדנאות ואירועים כדי להבין כיצד AI מגביר את היצירתיות. יש לנו שותפויות עם מוסדות תרבות מובילים, כולל LAS Art Foundation, Mori Art Museum, וTate, וקהילות יצירתיות כגון Rhizome וSocratica. בנוסף, אנו משתפים פעולה עם החברות שמאחורי כלי יצירה פופולריים כדי לחקור כיצד קלוד יכול להגביר את עבודת האמנים באמצעות Model Context Protocol (MCP).
מדענים. אנו משתפים פעולה עם מקבלני המענקים שלנו ל-AI למדע כדי להבין כיצד AI יכול לשרת בצורה הטובה ביותר את המחקר שלהם. באמצעות Anthropic Interviewer, אנו אוספים את נקודות המבט של מדענים על AI ואת תקוותיהם מהתוכנית (אנו נשתמש גם בכלי הניתוח שלנו השומר על פרטיות כדי להעריך האם שיחות הקלוד שלהם מתאימות לציפיות אלו). שילוב נתונים כמותיים ואיכותניים יעזור לנו לשפר את קלוד עבור מדענים ולמדוד את השפעות המענקים שלנו.
מורים. לאחרונה שיתפנו פעולה עם פדרציית המורים האמריקאית (AFT) כדי לעצב מחדש את אימון המורים בעידן של AI בעל יכולות הולכות וגדלות. תוכנית זו שואפת לתמוך ב-400,000 מורים בחינוך ל-AI ולהכניס את נקודת מבטם לפיתוח מערכות AI. בנוסף, הצגנו תובנות מסוימות מ-Anthropic Interviewer לגבי האופן שבו AI משנה את הנדסת התוכנה באנתרופיק. שיתוף סיפורים איכותניים על השינוי במקום העבודה שלנו הוביל אותנו למצוא הרבה מכנה משותף בין מהנדסי תוכנה למורים, מה שקיבץ את כולם סביב אותו שולחן כדי לפתור בעיות לגבי אילו שינויים בעבודה המונעים על ידי AI אנחנו באמת רוצים.

באמצעות Anthropic Interviewer, אנו יכולים לערוך מחקר ממוקד המזין מדיניות ספציפית, מחקר השתתפותי המערב קהילות שונות בשיחות על AI, ומחקרים קבועים העוקבים אחר הקשר המתפתח בין בני אדם ל-AI.

קחו חלק במחקר

אנו ממשיכים להשתמש ב-Anthropic Interviewer כדי להבין טוב יותר כיצד אנשים רואים את תפקיד ה-AI בחייהם ובעבודתם. לשם כך, אנו משיקים ראיון פיילוט ציבורי, הבוחן אילו חוויות, ערכים וצרכים מניעים את חזונם של אנשים לגבי תפקיד ה-AI העתידי בחייהם.

מוכנים לשתף את נקודת המבט שלכם? אתם יכולים להשתתף בראיון של 10-15 דקות בקישור זה כדי לקחת חלק במחקר. אנו מתכננים לנתח את התובנות האנונימיות ממחקר זה כחלק ממחקר ההשפעות החברתיות שלנו ולפרסם דו"ח על התובנות מנתונים אלה. למידע נוסף על מחקר זה, אנא עיינו בסעיף השאלות הנפוצות להלן.

מסקנות ומגבלות

הראיונות שלנו עם 1,250 אנשי מקצוע חושפים כוח עבודה המנהל באופן פעיל את יחסיו עם AI. המשתתפים שלנו שמרו באופן כללי על משימות מרכזיות לזהותם המקצועית תוך האצלת עבודה שגרתית לשם השגת רווחי פרודוקטיביות. אמנים אימצו את יעילות ה-AI למרות סטיגמת עמיתים וחששות כלכליים, בעוד שמדענים נותרו סלקטיביים לגבי אילו משימות מחקר הם מפקידים בידי ה-AI.

ערכנו מחקר זה כדי להבין את השפעת ה-AI על חיי אנשים מעבר למה שקורה בחלון הצ'אט. כמו כל ניתוח איכותני, הפרשנות שלנו לראיונות אלה משקפת את השאלות שבחרנו לשאול ואת הדפוסים שחיפשנו בנתונים. על ידי העמדת מאגר נתונים גדול זה של תמלילי ראיונות לציבור, אנו מקווים לקדם הבנה קולקטיבית של האופן שבו קשרי אדם-AI מתפתחים. ועל ידי פריסת Anthropic Interviewer בקנה מידה רחב, אנו יכולים ליצור לולאת משוב בין מה שאנשים חווים עם AI לבין האופן שבו אנו מפתחים אותו – במטרה לבנות מערכות AI המשקפות פרספקטיבות וצרכים ציבוריים.

המשתתפים היו חיוביים באופן יוצא דופן לגבי Anthropic Interviewer: 97.6% העניקו ציון 5 ומעלה לשביעות רצונם, וכמעט 50% העניקו את הציון הגבוה ביותר. 96.96% הרגישו שהשיחה שיקפה היטב את מחשבותיהם, ו-99.12% המליצו על פורמט הראיון לאחרים.

מגבלות

לשימוש הראשוני שלנו ב-Anthropic Interviewer יש כמה מגבלות חשובות המשפיעות על היקף הכלליות של ממצאינו. יש לפרש את ממצאינו כאיתותים מוקדמים להשפעת ה-AI על העבודה, ולא כמסקנות סופיות לגבי השפעותיה לטווח ארוך על הפרקטיקה והזהות המקצועית.

הטיית בחירה. מכיוון שהם גויסו באמצעות פלטפורמות עובדי קהל, חוויות המשתתפים במחקר שלנו עשויות להיות שונות באופן משמעותי מאלה של כוח העבודה הכללי, מה שמוטה תגובות לנקודות מבט חיוביות או מנוסות יותר בנושא.
מאפייני דרישה. המשתתפים ידעו שהם מרואיינים על ידי מערכת AI לגבי השימוש שלהם ב-AI, מה שיכול היה לשנות את נכונותם להשתתף, או לשנות את סוגי התגובות שהם נתנו בהשוואה לראיון עם אדם.
ניתוח סטטי. תפסנו תמונת מצב של השימוש והעמדות הנוכחיים של אנשי מקצוע ב-AI, אך עם נתונים אלה, איננו יכולים לעקוב אחר התפתחות היחסים הללו לאורך זמן, או כיצד התלהבות ראשונית עשויה להשתנות עם שימוש ממושך.
ניתוח רגשי. מכיוון ש-Anthropic Interviewer הוא טקסט בלבד ואינו יכול לקרוא טון קול, הבעות פנים או שפת גוף, הוא עלול לפספס רמזים רגשיים המשפיעים על משמעות הצהרות המרואיינים.
דיווח עצמי מול מדדים אובייקטיביים. ציינו לעיל כי תיאורי המשתתפים לגבי השימוש שלהם ב-AI עשויים להיות שונים מהפרקטיקות בפועל שלהם (כפי שנמצא במקרה של שימוש בסמארטפונים). זה יכול לנבוע מהטיית רצייה חברתית, זיכרון לא מושלם או נורמות משתנות במקום העבודה לגבי חשיפת AI. ואכן, נתוני הראיונות שלנו חשפו פערים מרכזיים בהשוואה לנתוני שימוש אמיתיים. פער זה בין תפיסה בפועל לבין בפועל מחזק את העמימות המהותית בדיווחים עצמיים: לדוגמה, תגובות לראיונות עשויות ללכוד שימוש שאיפות או השפעות רצייה חברתית. הבנת פערים אלה תהיה קריטית לפרשנות הממצאים במחקר מסוג זה.
פרשנות חוקרים. כמו כל מחקר איכותני, הניתוח שלנו משקף את תחומי העניין ונקודות המבט שלנו כחוקרים. למרות שהשתמשנו בשיטות שיטתיות לזיהוי דפוסים, חוקרים שונים עשויים להדגיש היבטים שונים של ראיונות אלה או להסיק מסקנות חלופיות.
כלליות גלובלית. המדגם שלנו משקף בעיקר עובדים מערביים, ועמדות תרבותיות כלפי AI, דינמיקת מקום העבודה וזהות מקצועית משתנות ככל הנראה באופן משמעותי בהקשרים גלובליים.
מחקר לא ניסיוני. למרות שמשתתפים רבים דיווחו על רווחי פרודוקטיביות ושיפורי איכות, איננו יכולים לקבוע האם השימוש ב-AI גרם ישירות לתוצאות אלה או באיזו מידה גורמים אחרים תרמו לכך.

אנתרופיק מודה לקונאל הנדה (Kunal Handa) שהוביל את הפרויקט ועיצב את הכלי, למייקל שטרן (Michael Stern) שהוביל את יישום הכלי בקלוד, ולכל הצוות והיועצים שסייעו בהוצאתו לפועל של המחקר החשוב הזה.

שאלות נפוצות בנוגע להשתתפות:

1. איך ניגשים למחקר? החל מהיום, אם אתם מנויי Claude.ai Free, Pro או Max שנרשמו לפני למעלה משבועיים, ייתכן שתבחינו בהודעה קופצת ב-Claude.ai המבקשת מכם להשתתף. ניתן לגשת אליו בכתובת: https://claude.ai/interviewer. המחקר יהיה פתוח למשך שבוע.
2. מה המחקר ישאל אותי? נשתמש ב-Anthropic Interviewer כדי לשאול אתכם על חזונכם לתפקיד ה-AI בחייכם, אילו חוויות, ערכים וצרכים מעצבים זאת, וכן מה עשוי לעזור או להפריע לחזון זה.
3. איך תשתמשו בנתונים? ננתח את התובנות ממחקר זה כחלק ממחקר ההשפעות החברתיות שלנו, נפרסם את ממצאינו, ונשתמש בהם כדי לשפר את המודלים והשירותים שלנו באופן המשקף את מה שלמדנו. הנתונים שנאספים באמצעות מחקר זה יטופלו כ"משוב" ויעובדו בהתאם למדיניות הפרטיות שלנו. אנו עשויים לכלול גם תגובות אנונימיות בממצאים המתפרסמים. למידע נוסף.