מודלי קידוד - כתבות

20 בפברואר 2025

פענוח ה-AI: אנתרופיק חושפת עבודה ראשונית ב-Crosscoder Model Diffing

אנתרופיק, חברת מחקר ובטיחות AI מובילה, מציגה הצצה לעבודתה המוקדמת בתחום ה-Crosscoder Model Diffing. מחקר זה, המצביע על צורך הולך וגובר בהבנת מודלי שפה גדולים מורכבים, נועד לשפר את ה'פרשנות' (interpretability) ואת יכולת השליטה במערכות AI. התובנות הראשוניות, שנדרש להתייחס אליהן כרעיונות ניסיוניים, מדגישות את מחויבות החברה לפתח AI אחראי ובטוח יותר, במיוחד בהקשרי קידוד.

קרא עוד