INFORMATION RETRIEVAL

Settore: INF/01Codice: 289AACrediti: 6Semestre: 1
Docenti: Ferragina Paolo

Obiettivi di apprendimento

Conoscenze

Lo studente che completerà con successo il percorso didattico avrà l'abilità e le conoscenze per progettare un semplice motore di ricerca e/o uno strumento di IR, utile nelle applicazioni moderne per il Web o i Big Data.

Modalità di verifica delle conoscenze

Gli studenti verranno valutati in base alle loro abilità e conoscenze acquisite sui contenuti del corso, attraverso una prova scritto/orale, accompagnata da eventuali prove intermedie.

Ulteriori informazioni possono essere trovare nella home page del corso.

Capacità

Gli studenti alla fine del percorso didattico saranno in grado di progettare e valutare motori di ricerca e IR tool, adottando soluzioni algoritmiche allo stato dell'arte.

Modalità di verifica delle capacità

Esame scritto e orale, con la possibilità di svolgere prove intermedie

Comportamenti

Gli studenti saranno esposti durante il corso al contesto dell'IR su Big Data testuali e non, le loro sfide, le scelte algoritmiche, e apprezzeranno l'impatto che le soluzioni efficienti in tempo e spazio viste in classe hanno sull'analisi, la ricerca e il mining di Big Data nelle applicazioni practiche.

Modalità di verifica dei comportamenti

Esame scritto e orale, con la possibilità di svolgere prove intermedie

Prerequisiti

Esami sul progetto di algoritmi, e conoscenze di programmazione e Math.

Indicazioni metodologiche

Lezioni di didattica frontale. L'apprendimento si realizzerà seguendo le lezioni in classe o attraverso video-lectures (a seconda delle condizioni COVID), e attraverso lo studio individuale.

Programma

Studio, progetto e analisi di sistemi di Information Retrieval che risultano efficienti ed efficaci nel processare, analizzare, memorizzare, ricercare, classificare e raggruppare documenti testuali e non. Le lezioni descriveranno

- le principali componenti di un motore di ricerca moderno: Crawler, Parser, Compressor, Indexer, Query resolver, Query and Document annotator, Results Ranker;

- le tecniche algoritmiche che sono alla base del progetto di applicazioni di IR per la compressione, l'indicizzazione e lo sketching di documenti;

- alcuni IR tool che sono utilizzati come componenti di motori di ricerca sofisticati oppure come tool indipendenti in applicazioni per processano Big Data, quali: Classification, Clustering, Recommendation, Random Sampling, Locality Sensitive Hashing.

Bibliografia

C.D. Manning, P. Raghavan, H. Schutze. Introduction to Information Retrieval. Cambridge University Press, 2008

Chapter 2 “Text compression” of Managing Gigabytes, I.H. Witten and A. Moffat and T.C. Bell, Morgan Kauffman, Second edition, 1999.

Alcune note in Inglese scritte dal docente

Non frequentanti

Come per i frequentanti

Modalità di esame

Esame scritto e orale, con la possibilità di svolgere prove intermedie

Pagina del corso

http://didawiki.di.unipi.it/doku.php/magistraleinformatica/ir/start

Fonte: ESSETRE e Portale esami