 |
Risorsa bibliografica obbligatoria |
 |
Risorsa bibliografica facoltativa |
|
Anno Accademico
|
2014/2015
|
Scuola
|
Scuola di Ingegneria Industriale e dell'Informazione |
Insegnamento
|
089167 - DATA MINING AND TEXT MINING (UIC 583)
|
Docente |
Lanzi Pierluca
|
Cfu |
5.00
|
Tipo insegnamento
|
Monodisciplinare
|
Corso di Studi |
Codice Piano di Studio preventivamente approvato |
Da (compreso) |
A (escluso) |
Insegnamento |
Ing Ind - Inf (Mag.)(ord. 270) - MI (434) INGEGNERIA INFORMATICA | * | A | ZZZZ | 089167 - DATA MINING AND TEXT MINING (UIC 583) | Ing Ind - Inf (Mag.)(ord. 270) - MI (474) TELECOMMUNICATION ENGINEERING - INGEGNERIA DELLE TELECOMUNICAZIONI | * | A | ZZZZ | 089167 - DATA MINING AND TEXT MINING (UIC 583) | Ing Ind - Inf (Mag.)(ord. 270) - MI (481) COMPUTER SCIENCE AND ENGINEERING - INGEGNERIA INFORMATICA | * | A | ZZZZ | 089167 - DATA MINING AND TEXT MINING (UIC 583) |
Programma dettagliato e risultati di apprendimento attesi |
SUMMARY
This course provides an introduction to Data Mining and an overview of all the most important algorithms used in this field. The course consists two sets of lectures. The first set, covering 24 hours, introduces the field of Data Mining and overviews all the main algorithms available in most commercial tools. The second set of lectures, covering 16 hours, focuses on specific application areas such as Text Mining, Bioinformatics, social networks, etc.
Students enrolled in the course of "Tecniche di Apprendimento Automatico per Applicazioni di Data Mining" need to attend only the first 20 hours of the course and can give the full exam in April/May during the first mid-term.
LIST OF TOPICS
- Introduction to Data Mining
- Understanding data and data representing
- Classification (decision trees, rules, Bayesian networks, etc.)
- Evaluation of classification algorithms
- Clustering
- Association rule mining
- Ensemble Methods (Bagging, Boosting, Random Forest)
- Support Vector Machines
- Text Mining
- Web Mining
- Data Exploration and Preprocessing
- Graph Mining and Social Networks
- Biological Data Analysis
- Data Streams
|
Note Sulla Modalità di valutazione |
The exam consists of a written test. During the course the exam will be splitted between a first term around April/May and a second term in June. During the course, we will announce an optional project, involving the analysis of real-world data, that the students can take if they wish.
All the material from previous courses is available at http://www.pierlucalanzi.net/teaching/data-mining-and-text-mining/
|
Pang-Ning Tan, Michael Steinbach, and Vipin Kumar, Introduction to Data Mining, Editore: Addison-Wesley, ISBN: 9780321321367 http://www.pearsonhighered.com/educator/academic/product/0,1144,0321321367,00.html
Ian H. Witten , Eibe Frank, and Mark A. Hall, Data Mining: Practical Machine Learning Tools and Technique, Editore: Morgan Kaufmann, Anno edizione: 2011, ISBN: 978-0123748560 http://www.pearsonhighered.com/educator/academic/product/0,1144,0321321367,00.html
|
Nessun software richiesto |
Tipo Forma Didattica
|
Ore didattiche |
lezione
|
24.0
|
esercitazione
|
16.0
|
laboratorio informatico
|
0.0
|
laboratorio sperimentale
|
0.0
|
progetto
|
0.0
|
laboratorio di progetto
|
24.0
|
Informazioni in lingua inglese a supporto dell'internazionalizzazione |
Insegnamento erogato in lingua

Inglese
|
Disponibilità di materiale didattico/slides in lingua inglese
|
Disponibilità di libri di testo/bibliografia in lingua inglese
|
Possibilità di sostenere l'esame in lingua inglese
|
Disponibilità di supporto didattico in lingua inglese
|
|