טרנספורמר

3 כתבות בנושא זה

5 באוקטובר 2023

לפרק את מודלי השפה: אנתרופיק חושפת יחידות חשיבה נסתרות ב-AI

חברת אנתרופיק (Anthropic), המובילה בתחום בטיחות ה-AI, פרסמה לאחרונה מחקר פורץ דרך המציע דרך חדשה לנתח ולהבין את מודלי השפה הגדולים (LLM). במקום להתמקד בנוירונים בודדים, המחקר מציג שיטה לפרק מודלי טרנספורמר קטנים ליחידות ניתוח מובחנות הנקראות 'פיצ'רים'. פיצ'רים אלו מייצגים שילובים לינאריים של פעילות נוירונים ומאפשרים לחשוף תכונות מודל ספציפיות ונסתרות, כמו זיהוי רצפי DNA או שפה משפטית, ובכך מקדמים את היכולת שלנו להבין וליישר מערכות AI מורכבות.

קרא עוד

16 במרץ 2023

בסיסים מועדפים בטרנספורמרים: אנתרופיק חושפת כיצד אלגוריתם Adam משפיע על מודלי AI

אנתרופיק (Anthropic), חברת מחקר ובטיחות AI מובילה, פרסמה מחקר פורץ דרך השופך אור על התנהגות בלתי צפויה במודלי טרנספורמר, הארכיטקטורה שעומדת בבסיסם של מודלי שפה גדולים (LLMs). המחקר מגלה כי בניגוד לתאוריה המתמטית, לא כל "נתיבי המידע" הפנימיים במודלים אלו שווים בחשיבותם, כאשר קיימים "בסיסים מועדפים" המקודדים מידע בצורה שונה. ממצאים ראשוניים מצביעים על כך שאלגוריתם האופטימיזציה Adam, המשמש לאימון מודלים, הוא הגורם להיווצרותם של בסיסים אלו, תגלית בעלת השלכות קריטיות על פרשנות, בטיחות ויישור (alignment) של מערכות AI.

קרא עוד

17 ביוני 2022

אנתרופיק מציגה: SoLU – הדרך החדשה להבנת מודלי AI

אנתרופיק, חברת מחקר ובטיחות בתחום ה-AI, פרסמה לאחרונה מחקר המציג שינוי ארכיטקטוני משמעותי במודלים שלה. באמצעות הטמעת יחידות ליניאריות מסוג Softmax, המכונות SoLU, החברה הצליחה להגדיל באופן ניכר את יכולת הניתוח הפנימי (interpretability) של רשתות נוירוניות, כמעט ללא פגיעה בביצועים. הממצאים מצביעים על הבנה טובה יותר של פעולת ה"מוח" של מודלי ה-AI, למרות חשש שהפתרון עשוי להסתיר תכונות אחרות. זהו צעד קדימה משמעותי במאמץ לייצר מערכות AI אמינות ושקופות יותר.

קרא עוד