logo-polimi
Loading...
Risorse bibliografiche
Risorsa bibliografica obbligatoria
Risorsa bibliografica facoltativa
Scheda Riassuntiva
Anno Accademico 2016/2017
Scuola Scuola di Ingegneria Industriale e dell'Informazione
Insegnamento 089167 - DATA MINING AND TEXT MINING (UIC 583)
Docente Lanzi Pier Luca
Cfu 5.00 Tipo insegnamento Monodisciplinare

Corso di Studi Codice Piano di Studio preventivamente approvato Da (compreso) A (escluso) Insegnamento
Ing - Civ (Mag.)(ord. 270) - MI (495) GEOINFORMATICS ENGINEERING - INGEGNERIA GEOINFORMATICA*AZZZZ089167 - DATA MINING AND TEXT MINING (UIC 583)
Ing Ind - Inf (Mag.)(ord. 270) - MI (474) TELECOMMUNICATION ENGINEERING - INGEGNERIA DELLE TELECOMUNICAZIONI*AZZZZ089167 - DATA MINING AND TEXT MINING (UIC 583)
Ing Ind - Inf (Mag.)(ord. 270) - MI (481) COMPUTER SCIENCE AND ENGINEERING - INGEGNERIA INFORMATICA*AZZZZ089167 - DATA MINING AND TEXT MINING (UIC 583)
Ing Ind - Inf (Mag.)(ord. 270) - MI (487) MATHEMATICAL ENGINEERING - INGEGNERIA MATEMATICA*AZZZZ089167 - DATA MINING AND TEXT MINING (UIC 583)

Programma dettagliato e risultati di apprendimento attesi

SUMMARY

This course provides an introduction to Data Mining and an overview of all the most important algorithms used in this field. The course consists two sets of lectures. The first set, covering 24 hours, introduces the field of Data Mining and overviews all the main algorithms available in most commercial tools. The second set of lectures, covering 16 hours, focuses on specific application areas such as Text Mining, Bioinformatics, social networks, etc. An optional project will be available near the end of the course (around the last week of May-first week of June).

LIST OF TOPICS

  • Introduction to Data Mining
  • Understanding data and data representing
  • Classification (decision trees, rules, Bayesian networks, etc.)
  • Evaluation of classification algorithms
  • Clustering
  • Association rule mining
  • Ensemble Methods (Bagging, Boosting, Random Forest)
  • Support Vector Machines
  • Text Mining
  • Web Mining
  • Data Exploration and Preprocessing
  • Graph Mining and Social Networks
  • Biological Data Analysis
  • Data Streams

Note Sulla Modalità di valutazione

The exam consists of a written test. During the course the exam will be splitted between a first term around April/May and a second term in June. During the course, we will announce an optional project, involving the analysis of real-world data, that the students can take if they wish.

All the material from previous courses is available on the BEEP platform.


Bibliografia
Risorsa bibliografica obbligatoriaJure Leskovec, Anand Rajaraman, Jeffrey D. Ullman, Mining of Massive Datasets http://www.dataminingbook.info/
Note:

PDF available for free at the book website

Risorsa bibliografica obbligatoriaMohammed J. Zaki and Wagner Meira, Jr., Data Mining and Analysis: Fundamental Concepts and Algorithms, Anno edizione: 2014, ISBN: 9780521766333 http://www.dataminingbook.info/
Note:

PDF available for free at the book website.

Risorsa bibliografica facoltativaIan H. Witten , Eibe Frank, and Mark A. Hall, Data Mining: Practical Machine Learning Tools and Technique, Editore: Morgan Kaufmann, Anno edizione: 2011, ISBN: 978-0123748560 http://www.pearsonhighered.com/educator/academic/product/0,1144,0321321367,00.html

Mix Forme Didattiche
Tipo Forma Didattica Ore didattiche
lezione
24.0
esercitazione
16.0
laboratorio informatico
0.0
laboratorio sperimentale
0.0
progetto
0.0
laboratorio di progetto
24.0

Informazioni in lingua inglese a supporto dell'internazionalizzazione
Insegnamento erogato in lingua Inglese
Disponibilità di materiale didattico/slides in lingua inglese
Disponibilità di libri di testo/bibliografia in lingua inglese
Possibilità di sostenere l'esame in lingua inglese
Disponibilità di supporto didattico in lingua inglese
schedaincarico v. 1.6.1 / 1.6.1
Area Servizi ICT
04/04/2020