| |||||||||||||||||||||||||
![]() |
![]() |
||||||||||||||||||||||||
נושאים מתקדמים בלמידה
Advanced Topics in Learning Theory |
0510-7450-01 | ||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
הנדסה | ביה"ס להנדסת חשמל | |||||||||||||||||||||||||
|
נושאים מתקדמים בלמידה
הקורס יסקור נושאים מתקדמים בלמידה חישובית עם דגש על למידה מקוונת ואופטימיזציה קמורה וגם שאלות פתוחות בלמידת רשתות ואופטימיזציה לא קמורה.
דרישות קדם
תורת ההסתברות, אלגברה לינארית, ידע בסיסי בחשבון דיפרנציאלי, ידע מוקדם בתורת הלמידה החישובית יועיל אך לא נדרש.
סילבוס
הסילבוס ייקבע לאורך הסמסטר ביחס להתקדמות הכיתה, נושאים פוטנציאלים שהקורס יסקור:
מודל הבסיסי של למידה פאק, למידה מקוונת ומושג החרטה: חסמי שגיאה, אלגוריתמים ווינו ופרספטרון, הכרעה מעצות מומחה, אלגוריתם משקול כפלי, אופטימיזציה מקוונת קמורה, מושגים בסיסיים באופטימיזציה קמורה: קמירות חזקה, חלקות, אלגוריתמים סדר ראשון, אלגוריתמים סדר שני. רגולריזציה, למידה מקוונת ללמידה סטטיסטית.
Adanced Topics in Learning
The course will survey some advanced topics in learning theory with a focus on online learning and convex optimization, as well as topics in neural network training and non-convex optimization
Prerequisites:
Basic Probability. Linear Algebra. Basic Calculus. Some prior informal-level knowledge of learning theory (such as an undergraduate course) is recommended but not required.
Syllabus:
The exact syllabus will be determined as the semester proceeds, based on the makeup of the class. A rough superset of the material covered includes:
The PAC model, Online learning model and notion of regret: Mistake bound, Winnow algorithm and perceptron, Expert Advice, and Multiplicative-Weight algorithm. The online convex optimization model and some examples.
Basic concepts in convex optimization: Strong convexity, smoothness, gradient descent.
First order algorithms: online gradient descent, and application to stochastic gradient descent.
Regularization: Regularized-FTL algorithm, online mirror descent and applications
Multi Armed-Bandit, setting and exp3 algorithm, Online to Batch, and agnostic learning through OCO.