logo-polimi
Loading...
Risorse bibliografiche
Risorsa bibliografica obbligatoria
Risorsa bibliografica facoltativa
Scheda Riassuntiva
Anno Accademico 2019/2020
Scuola Scuola di Ingegneria Industriale e dell'Informazione
Insegnamento 086449 - STATISTICA
Docente Boella Marco Ugo Claudio
Cfu 5.00 Tipo insegnamento Monodisciplinare

Corso di Studi Codice Piano di Studio preventivamente approvato Da (compreso) A (escluso) Insegnamento
Ing Ind - Inf (1 liv.)(ord. 270) - PC (354) INGEGNERIA MECCANICA*AZZZZ086449 - STATISTICA

Obiettivi dell'insegnamento

Obiettivi dell'insegnamento sono:


1) fornire tecniche e procedure per la descrizione sintetica e grafica delle informazioni fornite da insiemi di dati, 
2) introdurre al linguaggio e ai modelli per la rappresentazione e l’analisi di fenomeni aleatori, 
3) introdurre ai metodi e agli strumenti dell’inferenza statistica, 
4) applicare i metodi e le tecniche dell'analisi statistica di insiemi di dati reali per mezzo dell’utilizzo di un opportuno software statistico.


Risultati di apprendimento attesi

Si attendono la conoscenza e comprensione di

1) le nozioni di base del calcolo delle probabilità
2) gli ambiti di utilità e i limiti delle procedure della statistica inferenziale (in particolare stime puntuali, stime per intervalli, test d'ipotesi e regressione lineare)
3) i principi ed i comandi base di un software statistico

 

nonchè l'applicazione delle nozioni apprese per

1) scegliere un modello probabilistico/statistico adatto alla descrizione del fenomeno aleatorio che si cerca di modellizzare
2) calibrare il modello sui dati
3) utilizzare il modello per fare previsioni


Il docente si attende una comprensione non limitata all'enunciazione di definizioni e risultati e alla risoluzione di esercizi standard, ma critica ed in grado di distinguere le diverse situazioni e di compiere scelte consapevoli, giustificando i procedimenti seguiti. Si attende inoltre un'adeguata correttezza nei calcoli e un'esposizione ben argomentata della teoria.


Argomenti trattati

Statistica descrittiva.Tipi di dati. Tabelle di distribuzione di frequenza. Indici di posizione: media, moda, mediana. Media campionaria. Percentili e scarto interquartile. Varianza campionaria. Distribuzioni di frequenza per classi. Rappresentazioni grafiche di distribuzioni di frequenza per variabili qualitative e quantitative. Istogrammi. Box-Plot.

Elementi di calcolo delle probabilità. Esperimenti aleatori, variabili aleatorie e probabilità. Variabili aleatorie continue: densità, funzione di ripartizione, media e varianza. La distribuzione Normale. Vettori di variabili aleatorie. Distribuzione congiunte. Indipendenza stocastica. Variabili aleatorie discrete: densità, funzione di ripartizione, media e varianza. Distribuzioni di Bernoulli, Binomiale e di Poisson. Processo di Poisson e distribuzione esponenziale. Il Teorema Centrale del Limite. Approssimazione Normale per la distribuzione Binomiale e di Poisson. Normal probability plots.

Il problema della stima. Campioni casuali e statistiche. La stima puntuale di un parametro. Stima e stimatori: distorsione, errore quadratico medio, efficienza relativa. 

La verifica delle ipotesi. Criteri di decisione per la scelta tra due ipotesi: errore di primo tipo ed errore di secondo tipo. Test: regione di rifiuto, livello e funzione potenza. Potenza e dimensione campionaria. Valori p. Campionamento da una distribuzione Normale: test z e intervalli di confidenza per la media (varianza nota); test t e IC per la media (varianza incognita); test chi-quadrato e IC sulla varianza. Test e IC su una proporzione. Test chi-quadrato di buon adattamento. Test di Shapiro-Wilks. Test z e IC per il confronto tra due medie. Test t per il confronto tra due medie di due distribuzioni normali: ANOVA per due gruppi. Test t per il confronto tra due medie per dati accoppiati. Test e IC per il confronto di due proporzioni. Test F di confronto tra due varianze.

Regressione lineare. Dipendenza e correlazione. Regressione semplice e multipla. Stima ai minimi quadrati dei coefficienti di una regressione e della varianza del modello. Diagnostica: analisi dei residui, R-quadro. Test e IC per i coefficienti di una regressione. Previsione di una nuova osservazione. Scelta del modello nell'analisi di regressione multipla.

 


Prerequisiti

Nozioni di matematica di base (in particolare, teoria degli insiemi). Conoscenze di analisi matematica di base, tra cui: nozioni di limite, sommatoria, serie ed integrale di Riemann.


Modalità di valutazione

L'esame consta di una prova scritta ed eventualmente un progetto di analisi dei dati.
A discrezione del docente, il progetto di analisi dei dati potrebbe essere sostituito da alcune domande a risposta aperta o chiusa presenti negli scritti (in tal caso ne verrà data comunicazione in aula durante il corso).

Gli Esercizi proposti saranno volti a verificare la capacità dello studente di applicare le conoscenze acquisite e verteranno di norma sui seguenti argomenti:

Statistica descrittiva: Tipi di dati. Tabelle di distribuzione di frequenza. Indici di posizione: media, moda, mediana. Media campionaria. Percentili e scarto interquartile. Varianza campionaria. Distribuzioni di frequenza per classi. Rappresentazioni grafiche di distribuzioni di frequenza per variabili qualitative e quantitative. Istogrammi. Box-Plot.


Elementi di calcolo delle probabilità. Esperimenti aleatori, variabili aleatorie e probabilità. Variabili aleatorie continue: densità, funzione di ripartizione, media e varianza. Probabilità condizionata e formula di Bayes. La distribuzione Normale. Indipendenza stocastica. Variabili aleatorie discrete: densità, funzione di ripartizione, media e varianza. Distribuzioni di Bernoulli, Binomiale e di Poisson. Processo di Poisson e distribuzione esponenziale. Il Teorema Centrale del Limite. Approssimazione Normale per la distribuzione Binomiale e di Poisson. Normal probability plots.


Il problema della stima. Campioni casuali e statistiche. La stima puntuale di un parametro. Stima e stimatori: distorsione, errore quadratico medio, efficienza relativa.


La verifica delle ipotesi. Criteri di decisione per la scelta tra due ipotesi: errore di primo tipo ed errore di secondo tipo. Test: regione di rifiuto, livello e funzione potenza. Potenza e dimensione campionaria. Valori p. Campionamento da una distribuzione Normale: test z e intervalli di confidenza per la media (varianza nota); test t e IC per la media (varianza incognita); test chi-quadrato e IC sulla varianza. Test e IC su una proporzione. Test chi-quadrato di buon adattamento. Test z e IC per il confronto tra due medie. Test t per il confronto tra due medie di due distribuzioni normali: ANOVA per due gruppi. Test t per il confronto tra due medie per dati accoppiati. Test e IC per il confronto di due proporzioni.

Regressione lineare.


Il candidato avrà di norma 2 ore di tempo per svolgere la prova e dovrà consegnare il suo elaborato alla fine della prova. Il voto complessivo della prova scritta tiene conto sia delle risposte alle domande di Teoria, sia dello svolgimento degli Esercizi. Per superare l’esame è necessario ottenere una valutazione maggiore o uguale a 18.
Durante lo svolgimento di ogni prova d'esame lo studente non può consultare né avere con sé testi, appunti, telefoni cellulari o altre apparecchiature elettroniche, sono ammesse solo le calcolatrici tascabili e le tavole delle principali distribuzioni di probabilità. A discrezione del docente, gli studenti potranno usufruire di un formulario da loro redatto su foglio A4 (fronte-retro) manoscritto.

Non è previsto l'obbligo di sostenere una prova orale. Qualora lo studente lo richieda, essa consisterà nella discussione di un progetto di analisi dei dati.


Bibliografia

Forme didattiche
Tipo Forma Didattica Ore di attività svolte in aula
(hh:mm)
Ore di studio autonome
(hh:mm)
Lezione
26:00
39:00
Esercitazione
18:00
27:00
Laboratorio Informatico
6:00
9:00
Laboratorio Sperimentale
0:00
0:00
Laboratorio Di Progetto
0:00
0:00
Totale 50:00 75:00

Informazioni in lingua inglese a supporto dell'internazionalizzazione
Insegnamento erogato in lingua Italiano
Possibilità di sostenere l'esame in lingua inglese
schedaincarico v. 1.6.1 / 1.6.1
Area Servizi ICT
20/01/2020