
מסווגים חוקתיים מהדור הבא של אנתרופיק: אבטחה משופרת וחסכונית יותר מפני פריצות מגבלות
אנתרופיק (Anthropic), חברת מחקר ובטיחות AI מובילה, מציגה את הדור הבא של המסווגים החוקתיים שלה, 'Constitutional Classifiers++', המציעים הגנה חזקה ויעילה יותר מול פריצות מגבלות (jailbreaks) במודלי שפה גדולים. בעוד שהדור הראשון הפחית משמעותית את שיעור הפריצות, הוא הגיע עם עלויות חישוב גבוהות ועלייה קלה בשיעורי הסירוב לבקשות לגיטימיות. הפיתוח החדש, המתבסס על ארכיטקטורה דו-שלבית ושימוש באותות פנימיים של המודל, מציג שיפור דרמטי באבטחה, צמצום שיעור הסירוב לבקשות תמימות וחיסכון ניכר בעלויות התפעול, עם תוספת של כ-1% בלבד בעלות החישוב.
קרא עוד
