logo-polimi
Loading...
Risorse bibliografiche
Risorsa bibliografica obbligatoria
Risorsa bibliografica facoltativa
Scheda Riassuntiva
Anno Accademico 2018/2019
Scuola Scuola di Ingegneria Industriale e dell'Informazione
Insegnamento 053457 - IDENTIFICAZIONE DEI MODELLI E MACHINE LEARNING [C.I.]
  • 053456 - IDENTIFICAZIONE DEI MODELLI E MACHINE LEARNING [2]
Docente Vercellis Carlo
Cfu 5.00 Tipo insegnamento Modulo Di Corso Strutturato

Corso di Studi Codice Piano di Studio preventivamente approvato Da (compreso) A (escluso) Insegnamento
Ing Ind - Inf (Mag.)(ord. 270) - MI (471) BIOMEDICAL ENGINEERING - INGEGNERIA BIOMEDICA*AZZZZ088779 - IDENTIFICAZIONE DEI MODELLI E ANALISI DEI DATI 2
053458 - MACHINE LEARNING
053457 - IDENTIFICAZIONE DEI MODELLI E MACHINE LEARNING [C.I.]

Obiettivi dell'insegnamento

Il corso offre un’introduzione alle tecniche e agli algoritmi di machine learning e pattern recognition. Esso fornisce agli studenti le intuizioni e le idee che stanno alla base degli attuali metodi di machine learning, accanto a una trattazione dettagliata della maggior parte delle tecniche illustrate.

Il corso è coerente con il profilo curricolare complessivo nel perseguire gli obiettivi generali. In particolare, il corso contribuisce allo sviluppo delle seguenti competenze:

  • Comprendere i contesti nei quali risulta opportune utilizzare metodi di machine learning e data analysis
  • Identificare i trends, le tecnologie e le principali metodologie di Machine Learning
  • Progettare soluzioni di problem reali applicando le metodologie descritte

Risultati di apprendimento attesi

Al completamento del corso gli studenti avranno ottenuto:

  • Buona conoscenza dei componenti principali di machine learning: dati, algoritmi, selezione e complessità dei modelli.
  • Capacità di apprezzare le problematiche di apprendimento dai dati.
  • Conoscenza di un ampio spettro di algoritmi di machine learning.
  • Capacità di applicazione degli algoritmi a problemi reali.
  • Capacità di effettuare selezione dei modelli sulla base di opportune metriche.
  • Conoscenza della struttura matematica dei principali metodi e dei punti di forza e debolezza di ciascuno.
  • Conoscenza dei paradigmi di supervised e unsupervised learning.

Argomenti trattati

Introduzione a Machine Learning

Motivazioni di machine learning. Machine learning, artificial intelligence e big data. Applicazioni di machine learning. Rappresentazione dei dati di input. Processo di machine learning.

Exploratory data analysis

Data validation e cleansing, identificazione di outlier e missing values detection. Data transformation. Data reduction. Sampling. Feature selection. Features extraction mediante filtering. Principal component analysis. Data discretization. Analisi univariata: analisi grafica, misure di tendenza centrale, dispersione, posizionamento relativo, eterogeneità, analisi della densità empirica. Analisi bivariata: analisi grafica, correlazione, tabelle di contingenza. Analisi multivariata: analisi grafica, indici di correlazione.

Supervised learning: classificazione e regressione

Tassonomia dei metodi supervised. Valutazione di modelli di classificazione: holdout, cross-validation, matrici di confusione, curve ROC, guadagno cumulato e lift. Trattamento di attributi categorici. Nearest neighbor. Alberi di classificazione e regressione: separazione, arresto e pruning. Metodi bayesiani: bayesiani naive, reti bayesiane. Regressione logistica. Reti neurali: perceptrone di Rosenblatt, reti feed-forward a più livelli. Support vector machines: minimizzazione del rischio strutturale; iperpiani di margine massimo per la separazione lineare; separazione nonlineare. Regressione lineare semplice e multipla. Assunzioni relative ai residui. Least square regression: normalità e indipendenza dei residui, significatività dei coefficienti, analisi della varianza, coefficienti di determinazione e correlazione lineare, multicollinearità, limiti di confidenza e predizione. Selezione delle variabili predittive. Regressione ridge. Regressione lineare generalizzata.

Regole associative

Motivazione e valutazione delle regole associative. Regole associative a dimensione singola. Algoritmo Apriori: generazione degli itemset frequenti; generazione delle regole forti. Altre regole di associazione.

Clustering

Tassonomia dei modelli di clustering. Misure di affinità. Metodi di partizione: K-medie, K-medoidi. Metodi gerarchici: metodi di agglomerazione e di suddivisione. Valutazione dei modelli di clustering

Applicazioni e use cases

Applicazioni di marketing relazionale. Web mining. Social market analysis. Speech recognition. Text mining. Fraud and anomaly detection. Bioinformatics.


Prerequisiti

Machine Learning è una disciplina di confine tra matematica e computer science. Pertanto, si richiede un buon background in probabilità, algebra lineare e analisi, nonché esperienza con linguaggi di programmazione.


Modalità di valutazione

L'esame si svolge in forma scritta (esclusivamente in lingua italiana), e prevede risposte in forma aperta o chiusa. Alcune domande di carattere più teorico mirano a verificare l’acquisizione di conoscenze relative ai metodi e agli algoritmi. Altre domande di natura più applicativa mirano a verificare la capacità di applicare i metodi e gli algoritmi a casi reali, di comprendere gli output e di ricavare le implicazioni nel contesto applicativo.

Soltanto gli studenti registrati ufficialmente per una sessione potranno sostenere il corrispondente esame. Registrazioni tardive non saranno ammesse.


Bibliografia
Risorsa bibliografica obbligatoriaCarlo Vercellis, Business intelligence - Modelli matematici e sistemi per le decisioni, Editore: McGraw-Hill, Anno edizione: 2006, ISBN: 9788838663468 http://www.catalogo.mcgraw-hill.it/catlibro.asp?item_id=2007
Risorsa bibliografica facoltativaCarlo Vercellis, Business Intelligence: Data Mining and Optimization for Decision Making, Editore: Wiley, Anno edizione: 2009, ISBN: 9780470511381
Risorsa bibliografica facoltativaT. Hastie, R. Tibshirani, and J. Friedman, The Elements of Statistical Learning, Editore: Springer, Anno edizione: 2011
Risorsa bibliografica facoltativaE. Alpaydin, Introduction to Machine Learning, Editore: MIT press, Anno edizione: 2014
Risorsa bibliografica facoltativaA. Geron, Hands-On Machine Learning With Scikit-Learn and Tensorflow: Concepts, Tools, and Techniques to Build Intelligent Systems, Editore: O'Reilly, Anno edizione: 2017

Forme didattiche
Tipo Forma Didattica Ore di attività svolte in aula
(hh:mm)
Ore di studio autonome
(hh:mm)
Lezione
32:30
48:45
Esercitazione
0:00
0:00
Laboratorio Informatico
10:00
15:00
Laboratorio Sperimentale
0:00
0:00
Laboratorio Di Progetto
7:30
11:15
Totale 50:00 75:00

Informazioni in lingua inglese a supporto dell'internazionalizzazione
Insegnamento erogato in lingua Italiano
Disponibilità di libri di testo/bibliografia in lingua inglese
schedaincarico v. 1.5.6 / 1.5.6
Area Servizi ICT
19/06/2019