logo-polimi
Loading...
Risorse bibliografiche
Risorsa bibliografica obbligatoria
Risorsa bibliografica facoltativa
Scheda Riassuntiva
Anno Accademico 2018/2019
Scuola Scuola di Ingegneria Civile, Ambientale e Territoriale
Insegnamento 052408 - MODELLI STATISTICI E PROCESSI STOCASTICI
Docente Epifani Ilenia
Cfu 6.00 Tipo insegnamento Monodisciplinare
Didattica innovativa L'insegnamento prevede  3.0  CFU erogati con Didattica Innovativa come segue:
  • Blended Learning & Flipped Classroom

Corso di Studi Codice Piano di Studio preventivamente approvato Da (compreso) A (escluso) Insegnamento
Ing - Civ (Mag.)(ord. 270) - MI (489) INGEGNERIA PER L'AMBIENTE E IL TERRITORIO - ENVIRONMENTAL AND LAND PLANNING ENGINEERING*AZZZZ052408 - MODELLI STATISTICI E PROCESSI STOCASTICI
089112 - MODELLI STATISTICI E PROCESSI STOCASTICI

Obiettivi dell'insegnamento

L’obiettivo dell’insegnamento è avvicinare lo studente alla Statistica, intesa come arte di imparare dai dati. L’insegnamento ha due anime, metodologica e applicativa e si propone di fornire all’allievo modelli probabilistici e metodi statistici per l’analisi statistica di problemi ingegneristici dell'ambiente e del territorio. L’enfasi è posta sull’analisi statistica dei dati: si vuole promuovere una dimensione multidisciplinare proponendo casi di studio specifici per studenti che abbiano scelto ciascuno dei quattro percorsi consigliati in Difesa del suolo e prevenzione dai rischi naturali, Monitoraggio e diagnostica ambientale, Pianificazione e gestione delle risorse naturali e Tecnologie di risanamento ambientale

L'insegnamento prevede 3.0 CFU erogati con didattica innovativa in modalità di classe capovolta (flipped classroom). In particolare lo schema di innovazione si ritrova a) nella struttura induttiva (bottom up) dei contenuti,  b) nel lavoro di squadra degli studenti secondo un approccio di tipo operativo (hands-on), c) nello sviluppo di alcune competenze comunicative (cosiddette soft-skills) come scrivere una relazione e sapere presentare i risultati ad un pubblico.


Risultati di apprendimento attesi

A seguito del superamento dell’esame, lo studente 

  • conosce e comprende i modelli probabilistici per variabili aleatorie, vettori aleatori e processi stocastici,  gli strumenti della statistica descrittiva,  i problemi principali  di inferenza statistica (stima e verifica di ipotesi),  i modelli statistici con covariate  (Descrittore di Dublino [DdD] 1), 
  • è in grado di usare una terminologia probabilistica e statistica  adeguate (DdD 1),
  • è in grado di modellizzare in termini probabilistici e statistici problemi di Ingegneria dell’Ambiente e del Territorio  (DdD 2),
  • sa calcolare quantità probabilistiche rilevanti come: leggi marginali, condizionate e congiunte di vettori aleatori, leggi finito-dimensionali di processi stocastici e relative quantità fondamentali (per esempio, funzione di media, varianza e autocovarianza, medie e varianze condizionate),  probabilità di transizione e leggi limite di catene markoviane (DdD 2),
  • è in grado di selezionare gli strumenti statistici grafici e numerici opportuni per la descrizione e sintesi dei dati e di analizzarli, interpretarli ed inferire da essi, usando del software statistico (per esempio R, si veda http://www.r-project.org)  (DdD 2),
  • opera scelte progettuali di analisi dei dati in autonomia (DdD 3)
  • comunica i risultati della propria attività in modo chiaro e convincente (DdD 4 e 5),
  • lavora efficacemente come parte di una squadra (team work).

 

 


Argomenti trattati
  1. Statistica descrittiva. Analisi univariata: indici di centralità e di dispersione, asimmetria e curtosi, bimodalità,
    outliers, distribuzioni empiriche, barplot, istogrammi, boxplot, qqplot
    Analisi bivariata: tabella di contingenza, scatterplot, coefficiente di correlazione
    campionario, calcolo di indici in sottopopolazioni.
  2. Modelli probabilistici. Richiami su variabile aleatoria univariata discreta e assolutamente continua, funzione di ripartizione (fdr), densità di probabilità, valore atteso, varianza, sequenze di variabili aleatorie indipendenti, sequenza di prove di bernoulli, va binomiale, gaussiana. Vettori aleatori discreti e loro distribuzioni congiunte, marginali e condizionali, medie condizionate, indipendenza stocastica, indipendenza regressiva, non correlazione, media e varianza di variabili discrete e della somma di variabili indipendenti. Variabili aleatorie e vettori assolutamente continui: fdr congiunta, funzione di densità
    congiunta, marginale e condizionata, media condizionata. Medie e varianze di va continue
    e funzioni di va continue. Modelli probabilistici misti: costruzione di un modello congiunto a partire dall'assegnazione
    di una legge condizionale e una marginale. Famiglia di distribuzioni gamma e distribuzioni campionarie: chi-quadrato, t di student, F
    di Fisher. Matrice di covarianza e vettori gaussiani.
  3. Inferenza statistica. Richiami su stima puntuale e intervallare (intervalli di confidenza) e verifica di ipotesi. Test z e t di confronto di medie di popolazioni gaussiane e indipendenti, congiuntamente gaussiane, per grandi campioni, test chi-quadrato sulla varianza di popolazione gaussiana e sul tempo di vita medio esponenziale, test F sul rapporto di varianze per popolazioni gaussiane indipendenti e sul rapporto di tempi di vita medi di popolazioni esponenziali indipendenti.
  4. Modello di regressione multipla: modello di regressione lineare in forma matriciale, stimatori, intervalli di confidenza e verifica di ipotesi sui parametri di regressione, analisi dei residui, test di normalità di Shapiro, selezione del modello (procedura backward), covariate fattoriali, interazioni, predizione di risposte future.
  5. Analisi della varianza (ANOVA). Test di Bartlett, ANOVA a una via, a due vie, con e senza interazione. Confronti multipli delle medie (metodo congiunto T di Tukey).
  6. Processi stocastici. Definizioni, leggi finito-dimensionali, funzioni di media, varianza e autocovarianza. Cenni a processi stazionari in senso forte e in senso debole, processi a incrementi indipendenti, processi a incrementi indipendenti e stazionari, esempi di 
    speciali processi stocastici: processo gaussiano, processo di Wiener, processo di Poisson.
  7. Catene markoviane a tempo discreto con spazio degli stati finito: distribuzione iniziale, matrice di transizione,  legge congiunta, regolarità, legge stazionaria e legge limite.

I 3CFU erogati con didattica innovativa nella modalità classe capovolta (flipped classroom) riguardano soprattutto gli argomenti ai punti 1,3,4,5. In particolare, nel corso di 30 ore circa gli studenti saranno introdotti all’uso del software libero R. Il docente esemplificherà i punti 1,3,4,5 del programma su alcuni casi di studio dai quattro percorsi di Ingegneria per l'Ambiente e il Territorio (ciascuno dei quali prevede questo insegnamento). Gli studenti, raccolti in gruppi di 5/6, sceglieranno un progetto di analisi dei dati all'interno di una rosa di problemi proposti inerenti il loro specifico campo di specializzazione e individueranno gli opportuni metodi statistici da usare. Alcuni punti degli argomenti 1,3,4,5 saranno erogati con didattica innovativa secondo la modalità della blended classroom, per cui i gruppi studieranno il materiale fornito dal docente e lo presenteranno alla classe.


Prerequisiti

Per seguire l'insegnamento sono necessari contenuti introduttivi di calcolo delle probabilità e statistica, quali, per esempio, quelli trattati nell'insegnamento di Trattamento delle osservazioni. Qualche ora dell'insegnamento sarà riservata a un breve ripasso di calcolo delle probabilità e statistica, secondo quanto indicato nel programma.


Modalità di valutazione

La partecipazione diretta e costante alle lezioni dell'insegnamento è molto importante, anche ai fini della valutazione.

L’esame consiste in una prova scritta e nell'elaborazione di un progetto.

La prova scritta è costituita da esercizi su argomenti ai punti 2,3,6,7 in “Argomenti Trattati” e la valutazione sarà sommativa, cioè avverrà a conclusione del percorso in uno degli appelli d’esame previsti dal calendario accademico. Lo studente è obbligato ad iscriversi alla prova scritta che intende sostenere.

Il progetto di "Analisi statistica di dati ingegneristici" userà gli strumenti affinati ai punti 1,3,4,5 applicati a un problema tipico e suggerito da docenti e ricercatori delle aree tematiche di cui al percorso di appartenenza dello studente. Come regola generale, i progetti saranno sviluppati in gruppi di 5/6 studenti e la loro valutazione sarà formativa cioè avverrà con frequenza continuativa, perché si baserà su una presentazione iniziale, una intermedia di avanzamento del progetto (con slides di supporto e 10 minuti di tempo per gruppo durante l'insegnamento), una finale con slides e 20 minuti per gruppo (nella sessione invernale) e la consegna di una relazione finale di gruppo (della lunghezza indicativa di 10-20 pagine).  

Il superamento dell'esame è subordinato al raggiungimento della sufficienza (votazione non inferiore a 18/30) in ciascuna delle due parti (prova scritta e progetto). Il voto finale verbalizzato si ottiene facendo la media aritmetica tra i voti conseguiti, con peso equo (50% alla prova scritta e 50% alla parte di progetto).

L’esame finale consente allo studente di applicare le conoscenze acquisite circa i principi fondamentali, gli strumenti e i modelli di probabilità e statistica “notevoli” (nel senso di diffusi, popular) nei problemi di Ingegneria per l'Ambiente e il Territorio.

In particolare,

la parte scritta dell’esame consente allo studente di

• utilizzare le conoscenze acquisite dalla teoria per calcolare quantità fondamentali di modelli probabilistici come: leggi marginali, condizionate e congiunte di vettori aleatori, leggi finito-dimensionali di processi stocastici e relative quantità fondamentali (per esempio, funzione di media, varianza e autocovarianza, medie e varianze condizionate), probabilità di transizione e leggi limite di catene markoviane,

• impostare problemi di stima puntuale, intervallare e di verifica di ipotesi per popolazioni gaussiane, popolazioni esponenziali e grandi campioni,

mentre la parte di progetto consente allo studente di

• applicare gli strumenti di statistica descrittiva, modelli di regressione o tecniche ANOVA per risolvere problemi statistici tipici della professione di Ingegnere per l'Ambiente e il Territorio,

• dimostrare di essere in grado di lavorare in gruppo,

• scrivere una relazione e comunicare le scelte fatte, utilizzando gli strumenti del corso per risolvere problemi statistici dalle professioni dell'ingegneria dell'ambiente e del territorio.

 


Bibliografia
Risorsa bibliografica obbligatoriaIlenia Epifani, Appunti a cura del docente disponibili sulla pagina Beep del corso https://beep.metid.polimi.it/

Forme didattiche
Tipo Forma Didattica Ore di attività svolte in aula
(hh:mm)
Ore di studio autonome
(hh:mm)
Lezione
33:00
49:30
Esercitazione
13:12
19:48
Laboratorio Informatico
13:48
20:42
Laboratorio Sperimentale
0:00
0:00
Laboratorio Di Progetto
0:00
0:00
Totale 60:00 90:00

Informazioni in lingua inglese a supporto dell'internazionalizzazione
Insegnamento erogato in lingua Italiano
Disponibilità di materiale didattico/slides in lingua inglese
Disponibilità di libri di testo/bibliografia in lingua inglese
Disponibilità di supporto didattico in lingua inglese

Note Docente
schedaincarico v. 1.6.1 / 1.6.1
Area Servizi ICT
26/01/2020