| |||||||||||||||||||||||||
למידה עמוקה
Deep Learning |
0510-7255-01 | ||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
הנדסה | ביה"ס להנדסת חשמל | |||||||||||||||||||||||||
|
למידה עמוקה
20% שיעורי בית. 80% פרויקט סופי
- מבני רשתות עצביות: פרספטרון רב שכבתי, רשתות קונבולוציה, רשתות חוזרות, רשתות עם זכרון, רשתות שארית.
- אלגוריתם הbackpropagation
- אלגוריתם stochastic gradient descent ותכונותיו
-פונקציות מחיר ושיטות אופטימיזציה מסדר ראשון (גודל צעד משתנה, שיטת מומנטום, שיטת נסטרוב, אלגוריתם אדם ואחרים)
-למידה עמוקה עבור בעיות סיווג ורגרסיה
-מעבר מסיווג לזיהוי עצמים: שיטת region CNN (RCNN) והרחבותיה השונות, , YOLO, SSD ושיטות מתקדמות אחרות.
- פילוח סמנטי: בנייה של רשתות קונבלוציה מלאות מרשתות סיווג לשם פתרון בעיות פילוח. שיטת mask-RCNN להמרת רשתות גילוי עצמים לרשתות פילוח.
- שדות אקראיים מותנים ושימושיהם עם רשתות עמוקות
- למידת מטריקת מרחקים - triplet loss, contractive loss, angular loss, זיהוי פנים בעזרת למידה עמוקה
- למידה עמוקה עבור מודלי שפה – הקדמה קצרה על מודלים מרקובים נסתרים ומודלי שפה, מודל n-grams, ייצוגי מילים, שיטת word2vec, תרגום מכונה, שיטת המקודד-מפענח, מנגנון הattention.
- למידה עמוקה עבור דיבור – המרת תרגום לטקסט, זיהוי דובר, ייצור דיבור (מבנה wavenet).
- מודלים יוצרים – autoencoder, variational autoencoder, רשתות יריביות יוצרות (GAN), wasserstein GAN, GAN מעגלי.
- למידה עמוקה עבור מידע גיאומטרי – למידה עמוקה ספטרלית, pointNet.
ספרות:
Book: Ian Goodfellow and Yoshua Bengio and Aaron Courville, Deep Learning, MIT press
מאמרים חדשניים מהעת האחרונה הסוקרים שיטות חדשות בלמידה עמוקה
Deep learning
20% homework. 80% final project.
-Neural networks architectures: multilayer perceptron, convolutional neural networks (CNN), recurrent neural networks (RNN), long-short memory machines (LSTM), residual networks.
-The backpropagation algorithm
Stochastic gradient descent
-Loss functions and first-order methods for optimization (adaptive learning rate, Momentum, Nesterov, ADAM and more)
-Deep learning for classification and regression tasks
-From classification to object detection: the region CNN (RCNN) architecture and its various extensions, YOLO, SSD and other advanced techniques
-Semantic segmentation: the fully convolutional network (FCN) architecture for converting classification networks into segmentation ones and the mask-RCNN network for converting object detection networks to segmentation ones.
-Conditional random fields (CRF) and the usage with deep learning
-Metric learning - triplet loss, contractive loss, angular loss, Face recognition using deep learning-
- Deep learning for language modeling - a brief introduction to hidden markov models (HMM) and language models, n-grams, word embedding, the word-to-vec technique, machine translation, the encoder-decoder framework, the attention mechanism
- Deep learning for speech - speech to text techniques, speaker identification, speech generation (the wavenet architecture)
Generative models - Autoencoders, Variational autoencoders, generative adversarial networks (GAN), the wasserstein GAN, cyclic GAN
- Deep learning for geometric data - spectral deep learning, pointNet.
Literature:
Book: Ian Goodfellow and Yoshua Bengio and Aaron Courville, Deep Learning, MIT press
Various recent research papers on advances in deep learning