logo-polimi
Loading...
Risorse bibliografiche
Risorsa bibliografica obbligatoria
Risorsa bibliografica facoltativa
Scheda Riassuntiva
Anno Accademico 2019/2020
Scuola Scuola di Ingegneria Civile, Ambientale e Territoriale
Insegnamento 052408 - MODELLI STATISTICI E PROCESSI STOCASTICI
Docente Epifani Ilenia
Cfu 6.00 Tipo insegnamento Monodisciplinare
Didattica innovativa L'insegnamento prevede  3.0  CFU erogati con Didattica Innovativa come segue:
  • Blended Learning & Flipped Classroom

Corso di Studi Codice Piano di Studio preventivamente approvato Da (compreso) A (escluso) Insegnamento
Ing - Civ (Mag.)(ord. 270) - MI (489) INGEGNERIA PER L'AMBIENTE E IL TERRITORIO - ENVIRONMENTAL AND LAND PLANNING ENGINEERING*AZZZZ089112 - MODELLI STATISTICI E PROCESSI STOCASTICI
052408 - MODELLI STATISTICI E PROCESSI STOCASTICI

Obiettivi dell'insegnamento

L’obiettivo dell’insegnamento è avvicinare lo studente alla Statistica, intesa come arte di imparare dai dati. L’insegnamento ha due anime, metodologica e applicativa, e si propone di fornire all’allievo modelli probabilistici e metodi statistici per l’analisi statistica di problemi ingegneristici dell'ambiente e del territorio. L’enfasi è posta sull’analisi statistica dei dati: si vuole promuovere una dimensione multidisciplinare proponendo casi di studio specifici per studenti che abbiano scelto ciascuno dei quattro percorsi consigliati in Difesa del suolo e prevenzione dai rischi naturali, Monitoraggio e diagnostica ambientale, Pianificazione e gestione delle risorse naturali e Tecnologie di risanamento ambientale

L'insegnamento prevede 3.0 CFU erogati con didattica innovativa in modalità di classe capovolta (flipped classroom). In particolare lo schema di innovazione si ritrova a) nella struttura induttiva (bottom up) dei contenuti,  b) nel lavoro di squadra degli studenti secondo un approccio di tipo operativo (hands-on), c) nello sviluppo di alcune competenze comunicative come scrivere una relazione e sapere presentare i risultati ad un pubblico (soft-skills).


Risultati di apprendimento attesi

A seguito del superamento dell’esame, lo studente 

  • conosce e comprende i modelli probabilistici per variabili aleatorie, vettori aleatori e processi stocastici,  gli strumenti della statistica descrittiva, i problemi principali di inferenza statistica (stima e verifica di ipotesi),  i modelli statistici con covariate  (Descrittore di Dublino [DdD] 1), 
  • è in grado di usare una terminologia probabilistica e statistica  adeguate (DdD 1),
  • è in grado di modellizzare in termini probabilistici e statistici problemi di Ingegneria dell’Ambiente e del Territorio  (DdD 2),
  • sa calcolare quantità probabilistiche rilevanti come: leggi marginali, condizionate e congiunte di vettori aleatori, leggi finito-dimensionali di processi stocastici e relative quantità fondamentali (per esempio, medie e varianze condizionate, funzione di media, varianza e autocovarianza),  probabilità di transizione e leggi limite di catene markoviane (DdD 2),
  • è in grado di selezionare gli strumenti statistici grafici e numerici opportuni per la descrizione e la sintesi dei dati e di analizzarli, interpretarli ed inferire da essi, usando del software statistico (per esempio R, si veda http://www.r-project.org)  (DdD 2),
  • opera scelte progettuali di analisi dei dati in autonomia (DdD 3)
  • comunica i risultati della propria attività in modo chiaro e convincente (DdD 4 e 5),
  • lavora efficacemente come parte di una squadra (team work).

Argomenti trattati
  1. Statistica descrittiva. Analisi univariata: indici di centralità e di dispersione, asimmetria e curtosi, bimodalità,
    outliers, distribuzioni empiriche, barplot, istogrammi, boxplot, qqplot.
    Analisi bivariata: tabella di contingenza, scatterplot, coefficiente di correlazione campionario, calcolo di indici in sottopopolazioni.
  2. Modelli probabilistici.  Vettori aleatori discreti e loro distribuzioni congiunte, marginali e condizionali, medie condizionate. Variabili aleatorie e vettori assolutamente continui: funzione di ripartizione congiunta, funzioni di densità congiunta, marginali e condizionate, medie condizionate. Modelli probabilistici misti: costruzione di un modello congiunto a partire dall'assegnazione di una legge condizionale e una marginale. Indipendenza stocastica, indipendenza regressiva, non correlazione. Matrice di covarianza, vettori gaussiani, componenti principali di un vettore gaussiano. Famiglia di distribuzioni gamma. 
  3. Processi stocastici. Definizioni, leggi finito-dimensionali, funzioni di media, varianza e autocovarianza. Cenni a processi stazionari in senso forte e in senso debole,  a processi a incrementi indipendenti, a processi a incrementi indipendenti e stazionari. Esempi di speciali processi stocastici: processo gaussiano, processo gamma, processo di Poisson.
  4. Catene markoviane a tempo discreto con spazio degli stati finito: distribuzione iniziale, matrice di transizione,  leggi congiunte, regolarità della catena, legge stazionaria e legge limite.
  5. Inferenza statistica.  Distribuzioni delle statistiche campionarie: chi-quadrato, t di student, F di Fisher. Test z e t di confronto di medie di popolazioni gaussiane indipendenti, congiuntamente gaussiane, approssimati per grandi campioni. Test chi-quadrato sulla varianza di popolazione gaussiana, test F sul rapporto di varianze per popolazioni gaussiane indipendenti. Test di normalità di Shapiro.
  6. Modello di regressione multipla: modello di regressione lineare in forma matriciale, stimatori, intervalli di confidenza e verifica di ipotesi sui parametri di regressione, analisi dei residui, selezione del modello (procedura backward), covariate fattoriali, interazioni, predizione di risposte future.
  7. Confronti fra medie e confronti multipli (test post-hoc):  Analisi della varianza (ANOVA) a una via, a due vie, con e senza interazione, test di omoschedasticità di Bartlett,  test post-hoc di Tukey.  Approccio non parametrico: test di omoschedasticità di Levene, test di Kruskal-Wallis,  test post-hoc di Wilcoxon con la correzione di Bonferroni (test di Dunn).  
  8. Tecniche esplorative di analisi multivariata: cenni all'analisi delle componenti principali (PAC) e alla cluster analysis.

 

I 3CFU erogati con didattica innovativa nella modalità classe capovolta (flipped classroom) riguardano soprattutto gli argomenti ai punti 1,5,6,7,8. In particolare, nel corso di 30 ore circa gli studenti saranno introdotti all’uso del software libero R. Durante le ore di lezione, esercitazione e laboratorio saranno esemplificati i punti 1,5,6,7,8 del programma su alcuni casi di studio dai quattro percorsi di Ingegneria per l'Ambiente e il Territorio (ciascuno dei quali prevede questo insegnamento). Gli studenti, raccolti in gruppi da un minimo di 6  a un massimo di 8, sceglieranno un progetto di analisi dei dati all'interno di una rosa di problemi proposti inerenti il loro specifico campo di specializzazione e individueranno gli opportuni metodi statistici da usare. Alcuni punti degli argomenti ai punti 7,8 saranno erogati con didattica innovativa secondo la modalità della blended classroom, per cui alcuni gruppi studieranno il materiale fornito dal docente e lo presenteranno alla classe.


Prerequisiti

Per seguire l'insegnamento sono necessari i contenuti introduttivi di calcolo delle probabilità e statistica, quali, per esempio, quelli trattati nell'insegnamento di Trattamento delle osservazioni (1 Liv.). Se necessario, qualche ora dell'insegnamento sarà riservata a un breve ripasso di calcolo delle probabilità e statistica in particolare degli argomenti che seguono:

Modelli probabilistici. Richiami su variabile aleatoria univariata discreta e assolutamente continua, funzione di ripartizione (fdr), densità di probabilità, valore atteso, varianza, sequenze di variabili aleatorie indipendenti, sequenza di prove di Bernoulli, variabile aleatoria  binomiale, variabile aleatorie gaussiana, media e varianza di somme di variabili indipendenti, teorema centrale del limite.

Inferenza statistica. Richiami su stima puntuale, intervalli di confidenza e verifica di ipotesi. Intervalli di confidenza e verifica di ipotesi sulla media popolazione gaussiana e sulla media di popolazione non gaussiana nel caso di grandi campioni.


Modalità di valutazione

La partecipazione diretta e costante alle lezioni dell'insegnamento è molto importante, anche ai fini della valutazione.

L’esame consiste in una prova scritta e nell'elaborazione di un progetto.

La prova scritta è costituita da esercizi su argomenti ai punti 2,3,4 in “Argomenti Trattati” e la valutazione sarà sommativa, cioè avverrà a conclusione del percorso in uno degli appelli d’esame previsti dal calendario accademico. Lo studente è obbligato ad iscriversi alla prova scritta che intende sostenere.

Il progetto di "Analisi statistica di dati ingegneristici" userà gli strumenti affinati ai punti 1,5,6,7,8 applicati a un problema tipico, suggerito da docenti e ricercatori delle aree tematiche affini al percorso di appartenenza dello studente. Come regola generale, i progetti saranno sviluppati in gruppi di 6/8 studenti e la loro valutazione sarà formativa cioè avverrà con frequenza continuativa, perché si baserà su una presentazione iniziale, una intermedia di avanzamento del progetto (con slides di supporto e 10 minuti di tempo per gruppo durante l'insegnamento), una finale con slides e 20 minuti per gruppo (nella sessione invernale) e la consegna di una relazione finale di gruppo (della lunghezza indicativa di 10-20 pagine).  

Il superamento dell'esame è subordinato al raggiungimento di una votazione non inferiore a 15/30 in ciascuna delle due parti (prova scritta e progetto). Il voto finale verbalizzato si ottiene mediando le due valutazioni, con pesi 45% alla prova scritta e 55% alla parte di progetto. 

L’esame finale consente allo studente di applicare le conoscenze acquisite circa i principi fondamentali, gli strumenti e i modelli di probabilità e statistica “notevoli” (nel senso di diffusi, popular) nei problemi di Ingegneria per l'Ambiente e il Territorio.

In particolare,

la parte scritta dell’esame consente allo studente di

• utilizzare le conoscenze acquisite dalla teoria per calcolare quantità fondamentali di modelli probabilistici come: leggi marginali, condizionate e congiunte di vettori aleatori, leggi finito-dimensionali di processi stocastici e relative quantità fondamentali (per esempio, medie e varianze condizionate, funzione di media, varianza e autocovarianza), probabilità di transizione, probabilità congiunte  e leggi limite di catene markoviane,

mentre la parte di progetto consente allo studente di

• applicare gli strumenti di statistica descrittiva, inferenza statistica, modelli di regressione, tecniche  di confronti fra medie e confronti multipli, tecniche esplorative di analisi multivariata per risolvere problemi statistici tipici della professione di Ingegnere per l'Ambiente e il Territorio,

• dimostrare di essere in grado di lavorare in gruppo,

• scrivere una relazione e comunicare le scelte fatte, utilizzando gli strumenti del corso per risolvere problemi statistici dalle professioni dell'ingegneria dell'ambiente e del territorio.


Bibliografia
Risorsa bibliografica obbligatoriaIlenia Epifani, Appunti a cura del docente https://beep.metid.polimi.it/
Risorsa bibliografica obbligatoriaIlenia Epifani, Nicholas Tarabelloni, Eserciziario a cura del docente disponibile sulla pagina beep del corso https://beep.metid.polimi.it/
Risorsa bibliografica obbligatoriaSheldon M. Ross (Autore), F. Morandin (Traduttore),, Probabilita' e statistica per l'ingegneria e le scienze, Editore: Maggioli, Anno edizione: 2015, ISBN: 8891609943 https://beep.metid.polimi.it/
Note:

Capitolo 2: statistica descrittiva, Capitolo 8: verifica delle ipotesi, Capitolo 9: regressione, Capitolo 10: analisi della varianza, Capitolo 12, Sezione 12.4.3: test di Kruskal Wallis

Risorsa bibliografica facoltativaTutorial di R a cura di Francesca Gasperoni, Nicholas Tarabelloni https://beep.metid.polimi.it/
Risorsa bibliografica facoltativaJohnson, R.A. e Wichern, D.W., Applied Multivariate Statistical Analysis, Sixth Edition, Editore: Pearson New International Edition, Anno edizione: 2014, ISBN: 9780131877153
Note:

Capitolo 8: Principal Components, Capitolo 12, Sezioni 12.1-12.4: Clustering


Software utilizzato
Nessun software richiesto

Forme didattiche
Tipo Forma Didattica Ore di attività svolte in aula
(hh:mm)
Ore di studio autonome
(hh:mm)
Lezione
30:00
44:00
Esercitazione
14:00
21:00
Laboratorio Informatico
0:00
0:00
Laboratorio Sperimentale
0:00
0:00
Laboratorio Di Progetto
16:00
25:00
Totale 60:00 90:00

Informazioni in lingua inglese a supporto dell'internazionalizzazione
Insegnamento erogato in lingua Italiano
Disponibilità di materiale didattico/slides in lingua inglese
Disponibilità di libri di testo/bibliografia in lingua inglese
Disponibilità di supporto didattico in lingua inglese

Note Docente
schedaincarico v. 1.6.9 / 1.6.9
Area Servizi ICT
16/10/2021