
11 ביולי 2022
מודלי שפה יודעים (ברובם) מה הם יודעים: המחקר החשוב של אנתרופיק
חברת המחקר והבטיחות בתחום ה-AI, אנתרופיק (Anthropic), מפרסמת מחקר חלוצי הבוחן את יכולתם של מודלי שפה גדולים (LLM) להעריך את אמיתות הטענות שלהם עצמם ולחזות באילו שאלות יוכלו לענות נכונה. המחקר מראה כי מודלים גדולים ומכוילים היטב יכולים להעריך את הסבירות שאמירה כלשהי נכונה (P(True)), ואף לחזות מראש אם הם 'יודעים' את התשובה לשאלה (P(IK)). ממצאים אלו, המצביעים על שיפור בביצועים ובכיול ככל שהמודלים גדלים ומקבלים יותר הקשר, מהווים אבן דרך בפיתוח מודלי AI 'כנים' ואמינים יותר.
קרא עוד