Corso Vittorio Emanuele II, 39 - Roma 0669207671

Ingegneria Informatica (Anno Accademico 2020/2021) - Big Data

Piattaforme per i Big Data



Slides

Lezione n. 1: MAP-REDUCE
   Single Node vs. Cluster Architecture

   Redundant Storage & Distributed File System

   MapReduce: Overview

   Refinement & Implementation
Vai alla slide della lezione Marco Pirrone
Lezione n. 2: ANALISI DI ITEMSET FREQUENTI - Parte uno
   The market basket model

   Association Rules

   Computational Model

   Finding frequent pair
Vai alla slide della lezione Marco Pirrone
Lezione n. 3: ANALISI DI ITEMSET FREQUENTI - Parte due
   A-priori Algorithm

   PCY (Park-Chen-Yu) Algorithm

   Multistage Algorithm

   Multihash Algorithm

   Frequent itemsets in 2 passes or less
Vai alla slide della lezione Marco Pirrone
Lezione n. 4: INDIVIDUAZIONE DI ELEMENTI SIMILI - Parte uno
   Finding Similar Sets

   Shingling

   MinHashing
Vai alla slide della lezione Marco Pirrone
Lezione n. 5: INDIVIDUAZIONE DI ELEMENTI SIMILI - Parte due
   Locality-Sensitive Hashing

   Tuning LSH parameters
Vai alla slide della lezione Marco Pirrone
Lezione n. 6: CLUSTERING - Parte uno
   The problem of Clustering

   Hierarchical Clustering

   k-means clustering
Vai alla slide della lezione Marco Pirrone
Lezione n. 7: CLUSTERING - Parte due
   BFR Algorithm

   The CURE Algorithm
Vai alla slide della lezione Marco Pirrone
Lezione n. 8: SISTEMI DI RACCOMANDAZIONE - Parte uno
   Overview

   Types of Recommendations

   Content-Based Systems
Vai alla slide della lezione Marco Pirrone
Lezione n. 9: SISTEMI DI RACCOMANDAZIONE - Parte due
   Collaborative Filtering (user-user)

   Collaborative Filtering (item-item)

   Evaluating Recommender Systems
Vai alla slide della lezione Marco Pirrone
Lezione n. 10: RIDUZIONE DIMENSIONALE - Parte uno
   Dimensional Reduction Overview

   SVD Decomposition

   Dimensional Reduction with SVD
Vai alla slide della lezione Marco Pirrone
Lezione n. 11: RIDUZIONE DIMENSIONALE - Parte due
   Example of SVD

   Eigen-decomposition

   CUR decomposition
Vai alla slide della lezione Marco Pirrone
Lezione n. 12: ANALISI DI GRAFI DI GRANDI DIMENSIONE - Parte uno
   Graph Data

   Page Rank: the flow formulation

   Page Rank: the Matrix formulation
Vai alla slide della lezione Marco Pirrone
Lezione n. 13: ANALISI DI GRAFI DI GRANDI DIMENSIONE - Parte due
   Page Rank: Power Iteration Method

   Page Rank: the Google formulation
Vai alla slide della lezione Marco Pirrone
Lezione n. 14: ANALISI DI GRAFI DI GRANDI DIMENSIONE - Parte tre
   How do we actually compute the PageRank?

   Computing PageRank on Big Graphs

   Topic-Specific PageRank
Vai alla slide della lezione Marco Pirrone
Lezione n. 15: ANALISI DI GRAFI DI GRANDI DIMENSIONE - Parte quattro
   Application to Measuring Proximity in Graphs

   The Web Spam and Term Spam

   Spam Farming and Link Spam

   Combating the Web Spam

   HITS: Hubs and Authorities
Vai alla slide della lezione Marco Pirrone
Lezione n. 16: ADVERTISING SUL WEB
   Online Bipartite Matching and Greedy Algorithm

   Performance Based Web Advertising
Vai alla slide della lezione Marco Pirrone
Lezione n. 17: MACHINE LEARNING SU LARGA SCALA - Parte uno
   Neirest Neighbor

   Support Vector Machines

   SVM: Deriving the margin
Vai alla slide della lezione Marco Pirrone
Lezione n. 18: MACHINE LEARNING SU LARGA SCALA - Parte due
   SVM: How to compute the margin?

   Decision Trees
Vai alla slide della lezione Marco Pirrone