Didattica 2017-2018
Il Master Big Data è un master full-time erogato interamente online che avrà durata di un anno a partire da Novembre. L'attività didattica prevede due fasi principali: la prima fase, che copre il periodo da Novembre a fine Luglio, è dedicata alle lezioni frontali e attività progettuali; mentre la seconda fase, che copre il periodo Agosto-Dicembre, è dedicata al tirocinio di 475 ore che gli studenti svolgeranno presso i nostri partners.
L'attività didattica settimanale durante la prima fase prevede alcune ore di lezioni frontali concentrate dal mercoledì al sabato e delle ore di laboratorio (non obbligatorie) durante le quali gli studenti potranno esercitarsi sperimentando sul campo i metodi presentati a lezione con il supporto di tutor. Il consiglio del Master ha stabilito che ai fini del conseguimento del titolo sarà necessaria la presenza obbligatoria dello studente ad almeno il 70% delle ore di lezioni frontali. L'organizzazione didattica settimanale è descritta in dettaglio nelle seguenti immagini:
Crediti Formativi Universitari (CFU)
Il Credito Formativo Universitario (CFU) è l'unità di misura del volume di lavoro di apprendimento, richiesto ad un allievo in possesso di adeguata preparazione iniziale, per l'acquisizione di conoscenze ed abilità richieste da una certa attività formativa. Esso corrisponde a 25 ore di lavoro complessivo, che comprende sia le ore di didattica frontale, sia lo studio individuale, sia altri tipi di attività (come il tirocinio). Ogni attività formativa ha associato un certo numero di crediti, che vengono acquisiti con il superamento di una verifica del profitto, e non sostituiscono il voto.
L'attività didattica sarà supportata dall'uso della piattaforma Moodle, dove gli studenti troveranno tutto il materiale didattico.
Insegnamenti 2017-2018
Gli insegnamenti previsti, con i rispettivi obiettivi formativi, sono elencati di seguito.
Il modulo ha l'obiettivo di allineare le competenze informatiche ed analitiche di base degli studenti, in particolare in materia di basi di dati, di analisi esplorativa dei dati e di linguaggi di programmazione.
Il modulo si propone di introdurre le nozioni etico-legali di privacy, anonimato, trasparenza e discriminazione, anche in riferimento al quadro normativo comunitario e alla sua evoluzione in corso. Saranno mostrati i modelli e le tecnologie di privacy-by-design e di difesa dei diritti degli utenti, che permettono l'analisi di Big Data nel rispetto del diritto alla protezione dei dati personali, alla trasparenza e al trattamento non discriminatorio.
Il modulo prevede attività seminariali che riportano esperienze e casi di studio/uso di Big Data analytics e Social Mining da parte del laboratorio SoBigData.eu e delle aziende ed istituzioni partner del Master.
Il modulo prevede attività seminariali che riportano esperienze e casi di studio/uso di Big Data analytics e Social Mining da parte del laboratorio SoBigData.eu e delle aziende ed istituzioni partner del Master.
Il modulo presenta le tecniche di acquisizione di big data dalle principali sorgenti ad oggi disponibili, incluso dati telefonici, dati di navigazione satellitare, dati di acquisto e di consumo e dati da social media e social networks, open data e dati amministrativi, dati da sensori personali e ambientali. Vengono anche discusse le modalità partecipative di raccolta dei dati attraverso sistemi di crowdsourcing and crowdsensing come i giochi con scopo e le campagne virali.
Il modulo mira innanzitutto a presentare le caratteristiche principali dei processi di innovazione nelle imprese e nelle istituzioni. Oltre ad alcuni cenni teorici di economia dell’innovazione, enfasi verrà posta sulla gestione dei processi innovativi (ruolo della R&S, dell’Open Innovation, ecc.). Verranno poi descritte le nuove opportunità di innovazione rese possibili dagli avanzamenti recenti nei processi di raccolta ed elaborazione di dati su vasta scala. Infine, dopo avere spiegato i concetti e i modelli di business model e di start-up, verrà svolto un eservizio di business model innovation teso ad esplorare le potenzialità dei Big Data nell’aprire nuove possibilità di business.
Il modulo ha l'obiettivo di preparare gli studenti alla presentazione della conoscenza estratta dai Big Data attraverso narrazioni che sfruttano la multimedialità. Presenta anche le più significative esperienze recenti di giornalismo e narrazione basate su informazioni quantitative estratte da varie sorgenti di dati.
Il modulo presenta tecnologie e sistemi per la progettazione, il popolamento e l'interrogazione di Data Warehouse per il supporto alle decisioni. L’accento viene posto sulle tecnologie e sull’analisi di problemi applicativi utilizzando esempi e casi studio, con esercitazioni in laboratorio. Lo studente acquisirà conoscenze e capacità sulle principali tecnologie per la Business Intelligence come
ETL (Extract, Transform and Load), Data Warehousing, Analytics SQL, OLAP (Online Analytical Processing).
Il modulo si propone di fornire un’introduzione ai concetti di base del data mining e del processo di estrazione della conoscenza, con approfondimenti sui modelli analitici e gli algoritmi più diffusi per il clustering, la classificazione e la scoperta di patterns, anche in riferimento alle nuove sorgenti di Big Data.
Il corso introduce gli elementi principali per la comprensione dei mercati finanziari, la loro struttura e l'infrastruttura tecnologica. In particolare, il modulo fornisce un background sulla modellazione empirica di time series finanziari, individuando gli aspetti fondamentali della data science tra cui la memorizzazione dei dati, la latenza, l'high dimensional inference, ecc. Il modulo copre anche l'analisi semantica dei testi da news feed e social network per la previsione finanziaria. Infine, verranno presentati alcuni elementi di applicazioni computazionali e numerici a problemi finanziari, che vanno dal pricing all'ottimal execution e l'ottimizzazione del portafoglio.
Il modulo ha lo scopo di presentare metodi di base e tecniche di visualizzazione per la presentazione efficace di informazione preveniente da diverse sorgenti: dati strutturati (relazionali, gerarchie, alberi), dati relazionali (social network), dati temporali, dati spaziali e dati spazio-temporali. Attraverso lo studio di metodi e strumenti esistenti, verranno presentati alcuni scenari di analitica visuale.
Il modulo si propone di familiarizzare lo studente con i sistemi ad alte prestazioni per il trattamento e l'analisi di Big Data. Lo studente acquisirà competenze nell'uso di piattaforme NO-SQL per l'interrogazione e il mining di dataset di grandi dimensioni come alternativa dei sistemi di gestione di basi di dati tradizionali.
Il modulo prevede l'insegnamento dei moduli software che costituiscono un moderno motore di ricerca, e di analisi delle prestazioni e dei limiti computazionali delle soluzioni algoritmiche correntemente adottate per ciascuno di essi. Fondamenti pratici e teorici per l’organizzazione e l’analisi dei sistemi di IR.
Il modulo si propone di mostrare le principali tecniche di analisi dei dati spazio-temporali relativi al movimento di persone e veicoli al fine di comprendere la mobilità in un territorio. L'apprendimento sarà sostenuto da numerosi casi di studio sviluppati nel laboratorio SoBigData.eu.
Il modulo ha lo scopo di fornire agli studenti gli strumenti e le conoscenze necessarie ad analizzare dati su larga scala provenienti da Online Social Networks. Nel modulo vengono presentati gli strumenti di analisi necessari, vengono poi illustrati i risultati ottenuti applicando tali strumenti a vari tipi di reti sociali. Tali strumenti vengono applicati ai due modi principali di rappresentare una OSN tramite grafi, considerando cioè il social e l’interaction graph.
Nel corso delle ore di laboratorio, gli studenti applicano i concetti appresi a lezione su dataset reali di Online Social Networks. Vengono svolti laboratori sull'analisi dei vari tipi di grafo sociale visto a lezione. Gli studenti apprendono così l'utilizzo di strumenti software di riferimento per l'analisi di dati provenienti da Online Social Networks.
Il modulo presenta le principali tecniche di analisi e mining delle opinioni e delle preferenze degli utenti sulla base di Big Data provenienti dal web o da altre sorgenti. Particolare enfasi viene posta sull'uso delle tecniche di text mining per la comprensione del significato emotivo dei testi prodotti dagli utenti sui social media. L'apprendimento sarà sostenuto da numerosi casi di studio sviluppati nel laboratorio SoBigData.eu.
Il periodo di tirocinio previsto dal Master è di 500 ore, corrispondenti a 20 CFU, da svolgersi individualmente o in piccoli gruppi presso una delle aziende ed istituzioni partner del master, sulla base di un progetto concordato e sotto la supervisione di un team di tutor composto da docenti del master e responsabili aziendali.
Al termine del periodo di tirocinio, il candidato redige una tesina per descrivere il lavoro svolto, le metodologie utilizzate e i risultati dell'attività di tirocinio svolta presso l'azienda o l'istituzione ospitante. La tesi viene presentata dal candidato in sede di esame finale del master. La tesina viene valutata in base alla qualità del materiale presentato e alle capacità di analisi e di sintesi dimostrate dal candidato nella stesura della tesina stessa.
Periodo Tirocino: Settembre - Dicembre.
Il corso presenta le principali tecninche di analisi dei dati sel web.Usando i query log di un motore di ricerca come un caso di studio, gli studenti sono guidati nello sviluppo di un insieme di metodologie per l'analisi dei dati con lo scopo di creare la base di conoscenza utile a costruire un sistema di raccomandazione. Inoltre il corso discute come la stessa informazione possa essere ottimizzata per il ranking nei servizi web. In particolare il corso introduce tecniche di "learning to rank" che hanno lo scopo di stimare la rilevanza di oggetti rispetto ai bisogni di un utente.