2 נ.ז.
דרישות קדם: ניתוח נתונים סטטיסטי
הנדסת מערכות מידע
מחסני נתונים
איסוף, עיבוד וניתוח נתונים במימדי ענק, מגמה המכונה בשם Big Data, היא ללא ספק הדלק שמניע שירותים וירטואליים רבים כגון: פייסבוק, גוגל, אמזון ונטפליקס. נתונים אלה מביאים איתם הבטחות רבות, לא רק ברמת המשתמש שעליו נאסף המידע (פרודוקטיביות, הנאה, קישור למשתמשים אחרים ועוד.), אלא גם לנחלת הכלל (בתחומי השיווק, הבריאות, התחבורה ועוד.). במקביל, יכולות העיבוד של מחשבים משתפרות תמידית ואפשרויות האחסון נהיות זולות יותר מיום ליום.
קורס זה סוקר טכנולוגיות עיקריות לאחסון, עיבוד וניתוח נתוני ענק. במהלך הקורס ייסקרו שיטות לעיבוד מקבילי (Map Reduce), כלי חינמי המאפשר ליישם שיטות אלה על נתוני ענק ביעילות (Hadoop) ומספר הרחבות המאפשרות גישה נוחה לנתונים (Pig, Hive). ייבחנו בסיסי נתונים המתאימים לעבודה עם נתוני ענק (Scalable Relational Databases, In-Memory Databases, NoSQL Databases), תוך כדי התמקדות בתכונותיהם המאפשרות התאמה זאת. ינותחו אלגוריתמי למידת מכונה המאפשרים מקבול (SVM, Perceptrons, Nearest Neighbors) ויתוארו מספר טכניקות לניתוח רשתות חברתיות (SNA - גרפים, תכונות של גרפים, חלוקה של גרפים ועוד).