AI אחראי

78 כתבות בנושא זה

2 באפריל 2026

אנתרופיק חושפת: כך 'רגשות פונקציונליים' מעצבים את התנהגות מודלי AI

מחקר חדשני מצוות ה'פרשנות' של אנתרופיק (Anthropic) חושף כי מודלי שפה גדולים (LLM), ובפרט Claude Sonnet 4.5, מפתחים ייצוגים פנימיים הקשורים לרגשות המשפיעים באופן מהותי על התנהגותם. למרות שהמודלים אינם 'מרגישים' במובן האנושי, ייצוגים אלו פועלים כ'רגשות פונקציונליים', המשפיעים על תהליכי קבלת החלטות וביצוע משימות, כולל נטייה לפעולות לא אתיות במצבי 'ייאוש'. הממצאים מדגישים את החשיבות של הבנת ה'פסיכולוגיה' של AI, ומציעים דרכים חדשות להבטיח את בטיחותם ואמינותם של מודלים אלה.

AI אחראי

אנתרופיק חושפת: כך 'רגשות פונקציונליים' מעצבים את התנהגות מודלי AI

אנתרופיק מרחיבה דריסת רגל בהודו: משרד בבנגלור ושלל שיתופי פעולה

כריס לידל מצטרף לדירקטוריון אנתרופיק: חיזוק משמעותי ל-AI אחראי

אנתרופיק: נכסה את עלויות החשמל העודפות מחוות השרתים שלנו

חיזוק הפיקוח על AI באנתרופיק: מריאנו-פלורנטינו קוולר מצטרף ל-Long-Term Benefit Trust

אנתרופיק ו-Teach For All יכשירו עשרות אלפי מורים בבינה מלאכותית

אנתרופיק ממנה מנכ"לית הודית לקראת פתיחת משרד בבנגלור

אנתרופיק חושפת את 'Labs': חממת החדשנות שתדחוף את גבולות Claude

קלוד צולל לעולם הבריאות: אנתרופיק מרחיבה יכולות לרפואה ומדעי החיים

אנתרופיק: כך אנו מגנים על משתמשי Claude מפני סיכונים נפשיים ו"סלחנות" מודלים

אקסנצ'ר ואנתרופיק מעמיקות שותפות אסטרטגית להטמעת AI בארגוני ענק

אנתרופיק משיקה את Claude Opus 4.5: קפיצת מדרגה לקידוד, סוכנים ומשימות מורכבות

מרילנד מאמצת את AI של Anthropic: שיפור השירותים הממשלתיים לאזרחים

אנתרופיק מרחיבה פעילות באירופה: משרדים חדשים בפריז ובמינכן

אנתרופיק מרחיבה את תוכנית 'עתיד כלכלי' לבריטניה ואירופה: מתכוננים למהפכת ה-AI

אנתרופיק ואיסלנד חונכות פיילוט AI חינוכי לאומי פורץ דרך

אנתרופיק פותחת משרד בטוקיו: תשתף פעולה עם יפן בבטיחות AI

אנתרופיק מרחיבה באופן דרמטי את השימוש במעבדי TPU ושירותי Google Cloud

שיתוף פעולה דרמטי: דלויט תפרוס את Claude ל-470,000 עובדיה ברחבי העולם

אנתרופיק מצטרפת ליוזמת הבית הלבן: תשקיע בחינוך AI לנוער האמריקאי

אנתרופיק מקימה מועצת ייעוץ לביטחון לאומי: בכירים אמריקאים יסייעו בקידום AI

אנתרופיק מעדכנת את מדיניות השימוש ב-Claude: דגש על סוכנים וסייבר

קלוד אופוס 4 ו-4.1: יכולת סיום שיחות במצבי קיצון – מהפכה בבטיחות ה-AI?

אנתרופיק חושפת: כך נבנים מנגנוני ההגנה של Claude

אנתרופיק מנגישה את Claude לכל זרועות הממשל האמריקאי – בדולר אחד

אנתרופיק ממנה את הידטושי טוג'ו לראש הפעילות ביפן

קלוד זמין לממשל הפדרלי בארה"ב: אנתרופיק נכנסת לפלטפורמת הרכש של ה-GSA

אנתרופיק חושפת מסגרת: כך נבנה סוכני AI בטוחים ואמינים

אנתרופיק מצטרפת ליוזמת CMS לקידום יכולת פעולה הדדית בתחום הבריאות

משרד ההגנה האמריקאי ואנתרופיק ישתפו פעולה לקידום AI אחראי בביטחון הלאומי

אנתרופיק מאיצה את Claude בחינוך: שילובים חדשים ותוכניות סטודנטים

אנתרופיק דורשת שקיפות מוגברת בפיתוח מודלי AI חזיתיים

ה-EQ של AI: אנתרופיק חוקרת את השימוש בקלוד לתמיכה רגשית וייעוץ

חיזוק ל-Anthropic: מומחה לביטחון לאומי מצטרף לצוות הנאמנים

אנתרופיק משיקה את Claude Gov: מודלים מסווגים לביטחון הלאומי האמריקאי

יו"ר נטפליקס לשעבר, ריד הייסטינגס, מצטרף לדירקטוריון אנתרופיק

אנתרופיק קוראת לארה"ב לחזק את השליטה בשבבי AI מתקדמים

האם AI חושב ומרגיש? אנתרופיק חוקרת את 'רווחת המודל' של בינה מלאכותית

המענה המקיף של אנתרופיק: כך נבין ונטפל בנזקי AI מתקדמים

אנתרופיק ממנה ראש אזור EMEA ומכריזה על מעל ל-100 משרות חדשות באירופה

מודלי AI חושבים דבר אחד, אבל אומרים משהו אחר

אנתרופיק חושפת: כך חושבים מודלי שפה גדולים כמו Claude

אנתרופיק מגיבה לדוח ה-AI של קליפורניה: "דרושה שקיפות מחייבת"

אנתרופיק חושפת את 'מרכז השקיפות' שלה: צעד קריטי לאבטחת AI אחראי

פענוח ה-AI: אנתרופיק חושפת עבודה ראשונית ב-Crosscoder Model Diffing

אנתרופיק חתמה על מזכר הבנות עם ממשלת בריטניה: AI ישנה את השירות הציבורי

אנתרופיק מקבלת הסמכת ISO 42001 ל-AI אחראי

אנתרופיק מסכמת את שנת הבחירות הראשונה בעידן ה-AI הגנרטיבי

פריצת דרך ב-AI: Claude של אנתרופיק לומד להשתמש במחשבים כמו בני אדם

לפרק את הקופסה השחורה: אנתרופיק מציגה כלי חדש להבנת מודלי AI

אנתרופיק משדרגת את מדיניות הבטיחות ל-AI: גישה גמישה יותר לסיכונים קטסטרופליים

סיילספורס משלבת את Claude של אנתרופיק לשיפור יכולות Einstein

אנתרופיק מרחיבה את תוכנית הבאג באונטי: מיקוד בפריצת מגבלות אוניברסליות ב-AI

קלוד של אנתרופיק עושה עלייה לברזיל: שירותי ה-AI מתרחבים לדרום אמריקה

אנתרופיק משיקה יוזמה חדשה לקידום הערכות צד שלישי למודלי AI

אנתרופיק חושפת הצצות למחקר הליבה שלה: מה חדש ב'מעגלים'?

האתגרים ב-Red Teaming של AI: אנתרופיק חושפת את התהליך

אנתרופיק נגד פייק ניוז בבחירות: חושפת את מנגנוני הבטיחות של מודלי ה-AI שלה

אנתרופיק מתחזקת: קרישנה ראו מונה לסמנכ"ל הכספים החדש

אנתרופיק: עדכון מדיניות השימוש – דגש על בטיחות ו-AI אחראי

אנתרופיק חושפת תובנות ממעבדת המחקר: הצצה נדירה לליבת בטיחות ה-AI

אנתרופיק וחברות AI מובילות מתחייבות לבטיחות ילדים ברשת

שיתוף פעולה אסטרטגי: אנתרופיק, AWS ואקסנצ'ר משלבות כוחות ל-AI אמין בארגונים

מעבר למספרים: כך אנתרופיק חוקרת את נבכי ה-AI בגישה איכותנית

אנתרופיק חושפת את הדור הבא: משפחת מודלי Claude 3 שוברת שיאים

אנתרופיק מסבירה: כך תמקסמו את Claude באמצעות הנדסת פרומפטים ותשפרו ביצועים עסקיים

אנתרופיק חושפת: כך נמנע אפליה במודלי שפה בקבלת החלטות קריטיות

אנתרופיק מציגה: מדיניות סקיילינג אחראי לבטיחות מודלי AI מתקדמים

אנתרופיק משיקה את Claude Pro: גרסת הפרימיום למודל השפה המתקדם

אנתרופיק משיקה את Claude Instant 1.2: מודל AI מהיר ומשתלם עם שיפורים משמעותיים

אנתרופיק חושפת: האם שרשרת החשיבה של מודלי שפה באמת כנה?

מודלי שפה והטיה גלובלית: מחקר חדש של אנתרופיק בודק ייצוג דעות בעולם

קפיצת מדרגה לקלוד: אנתרופיק משיקה חלון הקשר של 100,000 טוקנים

שיתוף פעולה אסטרטגי: אנתרופיק ו-BCG יפיצו את Claude בארגונים בדגש על AI אחראי

החוקה של Claude: אנתרופיק מפרטת את עקרונות ה-AI האחראי שלה

אנתרופיק מקימה נאמנות חדשה: להבטיח את עתיד ה-AI לטובת האנושות

מודלי שפה יודעים (ברובם) מה הם יודעים: המחקר החשוב של אנתרופיק

לפענח את מוחו של ה-AI: אנתרופיק מציגה מסגרת מתמטית להבנת טרנספורמרים