INFORMATION RETRIEVAL
Settore: INF/01 | Codice: 289AA | Crediti: 6 | Semestre: 1 |
Docenti: Ferragina Paolo, Vinciguerra Giorgio |
Obiettivi di apprendimento
ConoscenzeLo studente che completerà con successo il percorso didattico avrà l'abilità e le conoscenze per progettare un semplice motore di ricerca e/o uno strumento di IR, utile nelle applicazioni moderne per il Web o i Big Data.
Modalità di verifica delle conoscenzeGli studenti verranno valutati in base alle loro abilità e conoscenze acquisite sui contenuti del corso, attraverso una prova scritto/orale, accompagnata da eventuali prove intermedie.
Ulteriori informazioni possono essere trovare nella home page del corso.
CapacitàGli studenti alla fine del percorso didattico saranno in grado di progettare e valutare motori di ricerca e IR tool, adottando soluzioni algoritmiche allo stato dell'arte.
Modalità di verifica delle capacitàEsame scritto e orale, con la possibilità di svolgere prove intermedie
ComportamentiGli studenti saranno esposti durante il corso al contesto dell'IR su Big Data testuali e non, le loro sfide, le scelte algoritmiche, e apprezzeranno l'impatto che le soluzioni efficienti in tempo e spazio viste in classe hanno sull'analisi, la ricerca e il mining di Big Data nelle applicazioni practiche.
Modalità di verifica dei comportamentiEsame scritto e orale, con la possibilità di svolgere prove intermedie
Prerequisiti
Esami sul progetto di algoritmi, e conoscenze di programmazione e Math.
Indicazioni metodologiche
Lezioni di didattica frontale, e attraverso lo studio individuale.
Programma
Studio, progetto e analisi di sistemi di Information Retrieval che risultano efficienti ed efficaci nel processare, analizzare, memorizzare, ricercare, classificare e raggruppare documenti testuali e non. Le lezioni descriveranno
- le principali componenti di un motore di ricerca moderno: Crawler, Parser, Compressor, Indexer, Query resolver, Query and Document annotator, Results Ranker;
- le tecniche algoritmiche che sono alla base del progetto di applicazioni di IR per la compressione, l'indicizzazione e lo sketching di documenti;
- alcuni IR tool che sono utilizzati come componenti di motori di ricerca sofisticati oppure come tool indipendenti in applicazioni per processano Big Data, quali: Recommendation, Random Sampling, Locality Sensitive Hashing.
Bibliografia
C.D. Manning, P. Raghavan, H. Schutze. Introduction to Information Retrieval. Cambridge University Press, 2008
Alcune note in Inglese scritte dal docente
Non frequentanti
Come per i frequentanti
Modalità di esame
Esame scritto e orale, con la possibilità di svolgere prove intermedie
Pagina del corso
http://didawiki.di.unipi.it/doku.php/magistraleinformatica/ir/ir23/startFonte: ESSETRE e Portale esami