תוכן הקורס ומטרתו
כמויות עתק של נתונים נאספים כבדרך שגרה בארגונים רבים, יוצרים הזדמנויות חדשות למדעני נתונים, אך גם יוצרים אתגרים חדשים ומעניינים. מטרתו של הקורס להקנות ידע ויכולות לתכנון, ניהול ותחקור של מסדי נתונים מאסיביים בארגונים. הנושאים בקורס יכללו הגדרה של מידע לאיסוף והקשר לאסטרטגיות ארגוניות, ארכיטקטורות לעיצוב מחסני הנתונים, תיאוריה של סיבוכיות אחסון ותחקור מסד הנתונים, תהליכי איסוף וטיוב מידע, ואלגוריתמים לתשאול ולניהול מידע בצורה מבוזרת. הטכנולוגיות שיילמדו בקורס יכללו מסדי נתונים רציונליים (Relational Databases) ומסדי נתונים מבוזרים כדוגמת Spark. מעל גבי טכנולוגיות אלו, נלמד ארכיטקטורות מידע שונות. במסדי נתונים יחסיים נלמד כיצד ניתן לבנות מחסן נתונים עמיד ויעיל בעזרת סכמת כוכב וסכמת פתית-שלג. במסדי נתונים מבוזרים, נלמד כיצד לארגן את הנתונים בצורה שמאפשרת שליפה מדויקת ויעילה. נושאים אלו יאפשרו לסטודנטים להבין את התיאוריה ולעסוק בפרקטיקה של תהליכי עיבוד מידע ממוכנים (pipelines) שמצליחים להתמודד עם נתוני עתק מאסיביים.
הסילבוס המפורט מפורסם לתלמידי הקורס בלבד