פיקוח מדרגי - כתבות

4 בנובמבר 2022

אנתרופיק בוחנת: האם נצליח לפקח על מודלי AI חזקים מאיתנו?

חברת המחקר והבטיחות אנתרופיק פרסמה מחקר פורץ דרך הבוחן את האתגר המורכב של 'פיקוח מדרגי' (scalable oversight) על מערכות בינה מלאכותית מתקדמות. המחקר עוסק ביכולת לפקח על מודלי AI שעלולים להצטיין מעל יכולות אנושיות במגוון משימות. באמצעות תכנון ניסויי חדשני, שבו מומחים אנושיים בסיוע מודל מצליחים במשימות בהן אדם ומודל לבדם נכשלים, אנתרופיק מדגימה היתכנות לגישה זו. הממצאים המעודדים מראים כי משתתפים אנושיים שנעזרו בעוזר דיאלוגי מבוסס LLM הצליחו באופן ניכר יותר, מה שמחזק את ההבנה שמודלי שפה גדולים יכולים לסייע ביעילות לבני אדם במשימות מורכבות.

קרא עוד