חיפוש חדש  חזור
מידע אישי לתלמיד

שנה"ל תשע"ט

  למידה ממוחשבת מחיזוקים
  Reinforcement Learning                                                                               
0368-3075-01
מדעים מדויקים
סמ'  ב'1000-1300001כיתות דן-דודשיעור פרופ מנצור ישי
ש"ס:  4.0

סילבוס מקוצר

 Introduction, Optimal Policy, Planning MDP (Bellman optimality equations), Value iteration,

Policy iteration, Dynamic Programming, Learning MDP (small state spaces), TD Learning,

Model base learning, Model free: Q learning, Policy gradient, Actor critic, 

Learning MDP (large state spaces), Deep Learning, Multi-Arm Bandit,

Inverse RL, POMDP

להצהרת הנגישות


אוניברסיטת ת