
17 בדצמבר 2024
קלוד 3.5 סונט מציב רף חדש ב-SWE-bench Verified לקידוד
קלוד 3.5 סונט, המודל המשודרג של אנתרופיק, הציג ביצועים פורצי דרך במדד SWE-bench Verified, והשיג ציון של 49% – גבוה ב-4% מהמודל המוביל הקודם. הכתבה מסבירה כיצד מערכת "סוכנים" (agent) מתוחכמת, המורכבת מהמודל וממערך תוכנה מינימלי, סייעה לקלוד להפגין יכולות הנדסת תוכנה מתקדמות ודיוק יוצא דופן ביצירת קוד. היא מתארת את שיטות ההערכה הטכניות ואת האתגרים הכרוכים בבחינת יכולות קידוד מורכבות של מודלי שפה גדולים.
קרא עוד