logo-polimi
Loading...
Risorse bibliografiche
Risorsa bibliografica obbligatoria
Risorsa bibliografica facoltativa
Scheda Riassuntiva
Anno Accademico 2016/2017
Scuola Scuola di Ingegneria Industriale e dell'Informazione
Insegnamento 094835 - DATA ANALYSIS AND RETRIEVAL
  • 094834 - INFORMATION RETRIEVAL AND DATA MINING
Docente Restelli Marcello
Cfu 5.00 Tipo insegnamento Modulo Di Corso Strutturato

Corso di Studi Codice Piano di Studio preventivamente approvato Da (compreso) A (escluso) Insegnamento
Ing Ind - Inf (Mag.)(ord. 270) - CO (480) MANAGEMENT ENGINEERING - INGEGNERIA GESTIONALE*AZZZZ094835 - DATA ANALYSIS AND RETRIEVAL
Ing Ind - Inf (Mag.)(ord. 270) - CO (482) COMPUTER SCIENCE AND ENGINEERING - INGEGNERIA INFORMATICA*AZZZZ094835 - DATA ANALYSIS AND RETRIEVAL
094751 - INFORMATION RETRIEVAL AND DATA MINING
Ing Ind - Inf (Mag.)(ord. 270) - MI (486) ENGINEERING PHYSICS - INGEGNERIA FISICA*AZZZZ094751 - INFORMATION RETRIEVAL AND DATA MINING
094835 - DATA ANALYSIS AND RETRIEVAL

Programma dettagliato e risultati di apprendimento attesi

Aims and learning outcomes

The course covers tools and systems adopted to handle big data, i.e., large collections of textual data. In the first part, the course focuses on the analysis of information embedded in large collections, using tools that range from decision trees, classification rules, association rules, graph-based link analysis. The second part of the course covers the efficient retrieval of information, discussing the algorithms and data structures adopted to enable answering keyword based queries, as well as indexing methods to enable fast search. 

 

Syllabus

Data mining

  • The Data Mining process
  • Decision Trees and Decision Rules
  • Rule Induction Methods
  • Association Rules
  • Frequent Itemset Analysis 

Web information retrieval

  • Web modelling and crawling
  • Graph-based retrieval models (PageRank, HITS)

Text-based information retrieval

  • IR models (Boolean models, vector space models, probabilistic models)
  • Evaluation of IR systems
  • Text processing
  • Advanced IR models (Latent Semantic Indexing)

Indexing

  • Inverted indexing
  • Multidimensional indexing
  • Rank aggregation

 

Teaching material

Lecture slides in electronic format covering the whole course will be distributed on the course web site http://chrome.ws.dei.polimi.it/index.php/Information_Retrieval_and_Data_Mining

 


Note Sulla Modalità di valutazione

Written exam. 


Bibliografia
Risorsa bibliografica facoltativaC. D. Manning, P. Raghavan and H. Schütze, Introduction to Information Retrieval, Editore: Cambridge University Press, Anno edizione: 2008
Risorsa bibliografica facoltativaPang-Ning Tan, Michael Steinbach, Introduction to Data Mining, Editore: Addison-Wesley, Anno edizione: 2006
Risorsa bibliografica facoltativaAnand Rajaraman, Jeffrey David Ullman, Mining of Massive Datasets, Editore: Cambridge University Press, Anno edizione: 2011

Mix Forme Didattiche
Tipo Forma Didattica Ore didattiche
lezione
30.0
esercitazione
20.0
laboratorio informatico
0.0
laboratorio sperimentale
0.0
progetto
0.0
laboratorio di progetto
0.0

Informazioni in lingua inglese a supporto dell'internazionalizzazione
Insegnamento erogato in lingua Inglese
Disponibilità di materiale didattico/slides in lingua inglese
Disponibilità di libri di testo/bibliografia in lingua inglese
Possibilità di sostenere l'esame in lingua inglese
Disponibilità di supporto didattico in lingua inglese
schedaincarico v. 1.6.1 / 1.6.1
Area Servizi ICT
02/04/2020