Corso Vittorio Emanuele II, 39 - Roma 0669207671

Ingegneria Informatica (Academic Year 2020/2021) - Big Data

Piattaforme per i Big Data


CFU: 9
Content language:
Course description

Quando si parla di Big Data, gli aspetti da considerare sono molteplici: ad esempio, quanto sono grandi i dataset, che tipo di analisi faremo, qual è il risultato atteso, ecc. In questo corso presenteremo una panoramica degli differenti aspetti collegati ai Big Data e descriveremo le piattaforme più diffuse in funzione della tipologia di problematiche affrontabili con ciascuna di esse.

Prerequisites

Corso di Introduzione ai Big Data

Objectives

Il corso ha lo scopo di fornire una conoscenza di base relativa alle diverse problematiche connesse alla gestione e l'analisi di Big Data, presentando le piattaforme più diffuse attualmente.

Program

Il corso analizzerà diversi aspetti relativi alla gestione e analisi dei Big Data, con particolare riferimento ai seguenti aspetti:

- Batch computation vs Streaming

- Real Time Analysis

- Python Pandas

- Notebook Jupyter

- Tidy dataset: R, Pandas e Apache Arrow

- Big Graph Data Processing: Pregel e Giraph

- Apache Spark e Storm

- Cassandra

Book

Slide del corso

Mining of Massive Datasets - Jure Leskovec, Anand Rajaraman, Jeff Ullman – Cambridge University Press

Big Data, Big Dupe – Stephen Few – Analytics Press

Exercises

Utilizzo di alcune piattoforme di analisi dati mediante il linguaggio python e notebook Jupyter.

Professor
Luigi Laura
List of lessons
    •  Lesson n. 1: MAP-REDUCE  Go to this lesson
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone