
20 בפברואר 2025
פענוח ה-AI: אנתרופיק חושפת עבודה ראשונית ב-Crosscoder Model Diffing
אנתרופיק, חברת מחקר ובטיחות AI מובילה, מציגה הצצה לעבודתה המוקדמת בתחום ה-Crosscoder Model Diffing. מחקר זה, המצביע על צורך הולך וגובר בהבנת מודלי שפה גדולים מורכבים, נועד לשפר את ה'פרשנות' (interpretability) ואת יכולת השליטה במערכות AI. התובנות הראשוניות, שנדרש להתייחס אליהן כרעיונות ניסיוניים, מדגישות את מחויבות החברה לפתח AI אחראי ובטוח יותר, במיוחד בהקשרי קידוד.
קרא עוד