logo-polimi
Loading...
Risorse bibliografiche
Risorsa bibliografica obbligatoria
Risorsa bibliografica facoltativa
Scheda Riassuntiva
Anno Accademico 2019/2020
Scuola Scuola di Ingegneria Industriale e dell'Informazione
Insegnamento 054059 - LABORATORIO DI STATISTICA PER ENERGETICA
Docente Menafoglio Alessandra
Cfu 5.00 Tipo insegnamento Prova Finale
Didattica innovativa L'insegnamento prevede  3.0  CFU erogati con Didattica Innovativa come segue:
  • Blended Learning & Flipped Classroom
  • Soft Skills

Corso di Studi Codice Piano di Studio preventivamente approvato Da (compreso) A (escluso) Insegnamento
Ing Ind - Inf (1 liv.)(ord. 270) - BV (352) INGEGNERIA ENERGETICA*AZZZZ054059 - LABORATORIO DI STATISTICA PER ENERGETICA

Obiettivi dell'insegnamento

Obiettivi dell'insegnamento sono: 

  • fornire le basi per comprendere metodi statistici per l’esplorazione e la rappresentazione grafica di insiemi di dati multivariati; 
  • introdurre agli strumenti statistici per la riduzione dimensionale e la classificazione di dati multivariati; 
  • fornire le competenze per applicare i metodi statistici appresi a insiemi di dati reali per mezzo dell’utilizzo di un opportuno software statistico. 

Risultati di apprendimento attesi

Conoscenza e comprensione. 

A seguito del superamento dell'esame, lo studente: 

  • conosce e comprende i modelli e metodi di statistica multivariata per la riduzione dimensionale e la classificazione;
  • conosce la terminologia adeguata; 

 Capacità di applicare conoscenza e comprensione

A seguito del superamento dell'esame, lo studente: 

  • è in grado di applicare i metodi e modelli statistici di esplorazione, riduzione dimensionale e classificazione all’analisi di dataset reali multivariati; 
  • è in grado di selezionare le metodologie statistiche appropriate al fine di ottenere soluzioni a problemi reali di analisi di dati; 
  • è in grado di descrivere, rappresentare e fornire sintesi da grandi quantità di dati; 
  • è in grado di descrivere, rappresentare e fornire sintesi dei risultati di un’analisi statistica multivariata.

Argomenti trattati

 

  • Metodi per l’esplorazione di dataset multivariati: statistica descrittiva e rappresentazioni grafiche. La media campionaria, la covarianza e la correlazione campionaria.
  • Metodi di riduzione dimensionale: l’analisi delle componenti principali basata sulla matrice di covarianza campionaria.
  • Classificazione supervisionata: la regressione logistica, k-nearest neighbors. Valutazione delle performance dei metodi per cross-validazione.
  • Classificazione non supervisionata: metodi di clustering gerarchico agglomerativo, concetti di similarità e dissimilarità, metodi di linkage; metodo k-means.
  • Metodi tree-based: alberi di classificazione e regressione; random forest.

 

Tutte le tecniche saranno estensivamente illustrate mediante casi studio. Il corso è offerto sotto forma di didattica innovativa, appoggiandosi al MOOC di Statistical Learning sviluppato da T. Hastie e R. Tibshiran per l'Università di Stanford.


Prerequisiti

L’insegnamento fa uso dei fondamenti di probabilità e statistica appresi nel corso di Statistica.


Modalità di valutazione

La verifica dell’apprendimento avverrà tramite la presentazione di un progetto di analisi di dati, svolto in gruppi di 1 o 2 persone. Il progetto dovrà vertere sull’analisi di un dataset multivariato reale e potrà essere presentato in una delle date d’appello previste dal calendario accademico. Durante lo svolgimento dell’attività progettuale, gli studenti dovranno dimostrare di essere in grado di svolgere l’analisi di dati multivariati tramite l’uso dei modelli e metodi appresi durante le lezioni frontali e nelle sessioni di didattica innovativa.

 In sede d'esame, lo studente dovrà: 

  • dimostrare il grado di comprensione degli aspetti fondamentali dell'insegnamento, esponendo in modo chiaro ed esaustivo le metodologie utilizzate;
  • dimostrare la propria capacità di applicare le nozioni apprese per svolgere analisi di dati reali.

La composizione della valutazione, espressa in 30esimi, terrà conto anche della chiarezza di esposizione e della appropriatezza dei metodi e dei modelli usati. 


Bibliografia
Risorsa bibliografica obbligatoriaJames G., Witten D., Hastie T. and Tibshirani R., An introduction to statistical learning, with application to R, Editore: Springer, Anno edizione: 2013 http://www-bcf.usc.edu/~gareth/ISL/
Risorsa bibliografica obbligatoriaHastie and Tibshirani, Statistical Learning MOOC, Anno edizione: 2014 http://www.r-bloggers.com/in-depth-introduction-to-machine-learning-in-15-hours-of-expert-videos/

Forme didattiche
Tipo Forma Didattica Ore di attività svolte in aula
(hh:mm)
Ore di studio autonome
(hh:mm)
Lezione
20:00
19:30
Esercitazione
0:00
10:30
Laboratorio Informatico
0:00
0:00
Laboratorio Sperimentale
0:00
0:00
Laboratorio Di Progetto
30:00
45:00
Totale 50:00 75:00

Informazioni in lingua inglese a supporto dell'internazionalizzazione
Insegnamento erogato in lingua Italiano
Disponibilità di materiale didattico/slides in lingua inglese
Disponibilità di libri di testo/bibliografia in lingua inglese
Possibilità di sostenere l'esame in lingua inglese
Disponibilità di supporto didattico in lingua inglese
schedaincarico v. 1.6.5 / 1.6.5
Area Servizi ICT
25/11/2020