Corso Vittorio Emanuele II, 39 - Roma 0669207671

Ingegneria Informatica (Ακαδημαϊκό έτος 2019/2020) - Big Data

Piattaforme per i Big Data


Πιστώσεις: 9
Γλώσσα περιεχομένου:Ιταλικά
Περιγραφή μαθήματος

Quando si parla di Big Data, gli aspetti da considerare sono molteplici: ad esempio, quanto sono grandi i dataset, che tipo di analisi faremo, qual è il risultato atteso, ecc. In questo corso presenteremo una panoramica degli differenti aspetti collegati ai Big Data e descriveremo le piattaforme più diffuse in funzione della tipologia di problematiche affrontabili con ciascuna di esse.

Προϋποθέσεις

Corso di Introduzione ai Big Data

Στόχοι

Il corso ha lo scopo di fornire una conoscenza di base relativa alle diverse problematiche connesse alla gestione e l'analisi di Big Data, presentando le piattaforme più diffuse attualmente.

Πρόγραμμα

Il corso analizzerà diversi aspetti relativi alla gestione e analisi dei Big Data, con particolare riferimento ai seguenti aspetti:

- Batch computation vs Streaming

- Real Time Analysis

- Python Pandas

- Notebook Jupyter

- Tidy dataset: R, Pandas e Apache Arrow

- Big Graph Data Processing: Pregel e Giraph

- Apache Spark e Storm

- Cassandra

Βιβλίο

Slide del corso

Mining of Massive Datasets - Jure Leskovec, Anand Rajaraman, Jeff Ullman – Cambridge University Press

Big Data, Big Dupe – Stephen Few – Analytics Press

Εργασίες

Utilizzo di alcune piattoforme di analisi dati mediante il linguaggio python e notebook Jupyter.

Περιοχή Καθηγητή
Luigi Laura
Λίστα μαγνητοσκοπημένων παραδόσεων
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone