Ing Ind - Inf (Mag.)(ord. 270) - MI (471) BIOMEDICAL ENGINEERING - INGEGNERIA BIOMEDICA
*
A
ZZZZ
053458 - MACHINE LEARNING
088779 - IDENTIFICAZIONE DEI MODELLI E ANALISI DEI DATI 2
053457 - IDENTIFICAZIONE DEI MODELLI E MACHINE LEARNING [C.I.]
Obiettivi dell'insegnamento
Il corso offre un’introduzione alle tecniche e agli algoritmi di machine learning e pattern recognition. Esso fornisce agli studenti le intuizioni e le idee che stanno alla base degli attuali metodi di machine learning, accanto a una trattazione dettagliata della maggior parte delle tecniche illustrate.
Il corso è coerente con il profilo curricolare complessivo nel perseguire gli obiettivi generali. In particolare, il corso contribuisce allo sviluppo delle seguenti competenze:
Comprendere i contesti nei quali risulta opportune utilizzare metodi di machine learning e data analysis
Identificare i trends, le tecnologie e le principali metodologie di Machine Learning
Progettare soluzioni di problem reali applicando le metodologie descritte
Risultati di apprendimento attesi
Al completamento del corso gli studenti avranno ottenuto:
Buona conoscenza dei componenti principali di machine learning: dati, algoritmi, selezione e complessità dei modelli.
Capacità di apprezzare le problematiche di apprendimento dai dati.
Conoscenza di un ampio spettro di algoritmi di machine learning.
Capacità di applicazione degli algoritmi a problemi reali.
Capacità di effettuare selezione dei modelli sulla base di opportune metriche.
Conoscenza della struttura matematica dei principali metodi e dei punti di forza e debolezza di ciascuno.
Conoscenza dei paradigmi di supervised e unsupervised learning.
Argomenti trattati
Introduzione a Machine Learning
Motivazioni di machine learning. Machine learning, artificial intelligence e big data. Applicazioni di machine learning. Rappresentazione dei dati di input. Processo di machine learning.
Exploratory data analysis
Data validation e cleansing, identificazione di outlier e missing values detection. Data transformation. Data reduction. Sampling. Feature selection. Features extraction mediante filtering. Principal component analysis. Data discretization. Analisi univariata: analisi grafica, misure di tendenza centrale, dispersione, posizionamento relativo, eterogeneità, analisi della densità empirica. Analisi bivariata: analisi grafica, correlazione, tabelle di contingenza. Analisi multivariata: analisi grafica, indici di correlazione.
Supervised learning: classificazione e regressione
Tassonomia dei metodi supervised. Valutazione di modelli di classificazione: holdout, cross-validation, matrici di confusione, curve ROC, guadagno cumulato e lift. Trattamento di attributi categorici. Nearest neighbor. Alberi di classificazione e regressione: separazione, arresto e pruning. Metodi bayesiani: bayesiani naive, reti bayesiane. Regressione logistica. Reti neurali: perceptrone di Rosenblatt, reti feed-forward a più livelli. Support vector machines: minimizzazione del rischio strutturale; iperpiani di margine massimo per la separazione lineare; separazione nonlineare. Regressione lineare semplice e multipla. Assunzioni relative ai residui. Least square regression: normalità e indipendenza dei residui, significatività dei coefficienti, analisi della varianza, coefficienti di determinazione e correlazione lineare, multicollinearità, limiti di confidenza e predizione. Selezione delle variabili predittive. Regressione ridge. Regressione lineare generalizzata.
Regole associative
Motivazione e valutazione delle regole associative. Regole associative a dimensione singola. Algoritmo Apriori: generazione degli itemset frequenti; generazione delle regole forti. Altre regole di associazione.
Clustering
Tassonomia dei modelli di clustering. Misure di affinità. Metodi di partizione: K-medie, K-medoidi. Metodi gerarchici: metodi di agglomerazione e di suddivisione. Valutazione dei modelli di clustering
Applicazioni e use cases
Applicazioni di marketing relazionale. Web mining. Social market analysis. Speech recognition. Text mining. Fraud and anomaly detection. Bioinformatics.
Prerequisiti
Machine Learning è una disciplina di confine tra matematica e computer science. Pertanto, si richiede un buon background in probabilità, algebra lineare e analisi, nonché esperienza con linguaggi di programmazione.
Modalità di valutazione
L'esame si svolge in forma scritta (esclusivamente in lingua italiana), e prevede risposte in forma aperta o chiusa. Alcune domande di carattere più teorico mirano a verificare l’acquisizione di conoscenze relative ai metodi e agli algoritmi. Altre domande di natura più applicativa mirano a verificare la capacità di applicare i metodi e gli algoritmi a casi reali, di comprendere gli output e di ricavare le implicazioni nel contesto applicativo.
Soltanto gli studenti registrati ufficialmente per una sessione potranno sostenere il corrispondente esame. Registrazioni tardive non saranno ammesse.
Bibliografia
Carlo Vercellis, Business intelligence - Modelli matematici e sistemi per le decisioni, Editore: McGraw-Hill, Anno edizione: 2006, ISBN: 9788838663468 http://www.catalogo.mcgraw-hill.it/catlibro.asp?item_id=2007Carlo Vercellis, Business Intelligence: Data Mining and Optimization for Decision Making, Editore: Wiley, Anno edizione: 2009, ISBN: 9780470511381
T. Hastie, R. Tibshirani, and J. Friedman, The Elements of Statistical Learning, Editore: Springer, Anno edizione: 2011
E. Alpaydin, Introduction to Machine Learning, Editore: MIT press, Anno edizione: 2014
A. Geron, Hands-On Machine Learning With Scikit-Learn and Tensorflow: Concepts, Tools, and Techniques to Build Intelligent Systems, Editore: O'Reilly, Anno edizione: 2017
Software utilizzato
Nessun software richiesto
Forme didattiche
Tipo Forma Didattica
Ore di attività svolte in aula
(hh:mm)
Ore di studio autonome
(hh:mm)
Lezione
32:30
48:45
Esercitazione
0:00
0:00
Laboratorio Informatico
10:00
15:00
Laboratorio Sperimentale
0:00
0:00
Laboratorio Di Progetto
7:30
11:15
Totale
50:00
75:00
Informazioni in lingua inglese a supporto dell'internazionalizzazione
Insegnamento erogato in lingua
Italiano
Disponibilità di libri di testo/bibliografia in lingua inglese