logo-polimi
Loading...
Risorse bibliografiche
Risorsa bibliografica obbligatoria
Risorsa bibliografica facoltativa
Scheda Riassuntiva
Anno Accademico 2014/2015
Scuola Scuola di Ingegneria Industriale e dell'Informazione
Insegnamento 089167 - DATA MINING AND TEXT MINING (UIC 583)
Docente Lanzi Pierluca
Cfu 5.00 Tipo insegnamento Monodisciplinare

Corso di Studi Codice Piano di Studio preventivamente approvato Da (compreso) A (escluso) Insegnamento
Ing Ind - Inf (Mag.)(ord. 270) - MI (434) INGEGNERIA INFORMATICA*AZZZZ089167 - DATA MINING AND TEXT MINING (UIC 583)
Ing Ind - Inf (Mag.)(ord. 270) - MI (474) TELECOMMUNICATION ENGINEERING - INGEGNERIA DELLE TELECOMUNICAZIONI*AZZZZ089167 - DATA MINING AND TEXT MINING (UIC 583)
Ing Ind - Inf (Mag.)(ord. 270) - MI (481) COMPUTER SCIENCE AND ENGINEERING - INGEGNERIA INFORMATICA*AZZZZ089167 - DATA MINING AND TEXT MINING (UIC 583)

Programma dettagliato e risultati di apprendimento attesi

SUMMARY

This course provides an introduction to Data Mining and an overview of all the most important algorithms used in this field. The course consists two sets of lectures. The first set, covering 24 hours, introduces the field of Data Mining and overviews all the main algorithms available in most commercial tools. The second set of lectures, covering 16 hours, focuses on specific application areas such as Text Mining, Bioinformatics, social networks, etc.

Students enrolled in the course of "Tecniche di Apprendimento Automatico per Applicazioni di Data Mining" need to attend only the first 20 hours of the course and can give the full exam in April/May during the first mid-term.

LIST OF TOPICS

  • Introduction to Data Mining
  • Understanding data and data representing
  • Classification (decision trees, rules, Bayesian networks, etc.)
  • Evaluation of classification algorithms
  • Clustering
  • Association rule mining
  • Ensemble Methods (Bagging, Boosting, Random Forest)
  • Support Vector Machines
  • Text Mining
  • Web Mining
  • Data Exploration and Preprocessing
  • Graph Mining and Social Networks
  • Biological Data Analysis
  • Data Streams

Note Sulla Modalità di valutazione

The exam consists of a written test. During the course the exam will be splitted between a first term around April/May and a second term in June. During the course, we will announce an optional project, involving the analysis of real-world data, that the students can take if they wish.

All the material from previous courses is available at http://www.pierlucalanzi.net/teaching/data-mining-and-text-mining/


Bibliografia
Risorsa bibliografica facoltativaPang-Ning Tan, Michael Steinbach, and Vipin Kumar, Introduction to Data Mining, Editore: Addison-Wesley, ISBN: 9780321321367 http://www.pearsonhighered.com/educator/academic/product/0,1144,0321321367,00.html
Risorsa bibliografica facoltativaIan H. Witten , Eibe Frank, and Mark A. Hall, Data Mining: Practical Machine Learning Tools and Technique, Editore: Morgan Kaufmann, Anno edizione: 2011, ISBN: 978-0123748560 http://www.pearsonhighered.com/educator/academic/product/0,1144,0321321367,00.html

Software utilizzato
Nessun software richiesto

Mix Forme Didattiche
Tipo Forma Didattica Ore didattiche
lezione
24.0
esercitazione
16.0
laboratorio informatico
0.0
laboratorio sperimentale
0.0
progetto
0.0
laboratorio di progetto
24.0

Informazioni in lingua inglese a supporto dell'internazionalizzazione
Insegnamento erogato in lingua Inglese
Disponibilità di materiale didattico/slides in lingua inglese
Disponibilità di libri di testo/bibliografia in lingua inglese
Possibilità di sostenere l'esame in lingua inglese
Disponibilità di supporto didattico in lingua inglese
schedaincarico v. 1.8.3 / 1.8.3
Area Servizi ICT
24/09/2023