TEXT ANALYTICS

Settore: INF/01Codice: 635AACrediti: 6Semestre: 1
Docenti: Esuli Andrea

Obiettivi di apprendimento

Conoscenze

Apprendimento di tecniche, algoritmi e modelli fondamentali utilizzati nell'elaborazione del linguaggio naturale. Comprensione delle architetture delle tipiche applicazioni di analisi del testo e delle librerie per la loro realizzazione. Competenza nella progettazione, implementazione e valutazione di applicazioni che sfruttano l'analisi, l'interpretazione e la trasformazione dei testi.

Modalità di verifica delle conoscenze

Gli studenti applicheranno i concetti e i metodi presentati durante il corso nello sviluppo di un progetto.

Capacità

Capacità di progettare, implementare e valutare applicazioni che sfruttano l'analisi, l'interpretazione e la trasformazione dei testi.

Modalità di verifica delle capacità

Gli studenti applicheranno i concetti e i metodi presentati durante il corso nello sviluppo di un progetto.

Comportamenti

Gli studenti saranno in grado di analizzare un problema di elaborazione del testo, selezionare i metodi corretti per risolverlo e implementare una soluzione funzionante.

Modalità di verifica dei comportamenti

Gli studenti applicheranno i concetti e i metodi presentati durante il corso nello sviluppo di un progetto.

Prerequisiti

Prerequisiti utili:

  • Coding (python)
  • Teoria della probabilità
  • Teoria dell'informazione

Programma

  1. Disciplinary background: Natural Language Processing, Information Retrieval and Machine Learning
  2. Mathematical background: Probability, Statistics and Algebra
  3. Linguistic essentials: words, lemmas, morphology, PoS, syntax
  4. Basic text processing: regular expression, tokenisation
  5. Data collection: twitter API, scraping
  6. Basic modelling: collocations, language models
  7. Introduction to Machine Learning: theory and practical tips
  8. Libraries and tools: NLTK, Spacy, Keras, pytorch
  9. Classification/Clustering
  10. Sentiment Analysis/Opinion Mining
  11. Information Extraction/Relation Extraction/Entity Linking
  12. Transfer learning
  13. Quantification

Bibliografia

  1. C. Manning, H. Schutze. Foundations of Statistical Natural Language Processing. MIT Press, 2000.
  2. D. Jurafsky, J.H. Martin, Speech and Language Processing. 2nd edition, Prentice-Hall, 2008.
  3. S. Bird, E. Klein, E. Loper. Natural Language Processing with Python.

Non frequentanti

Gli studenti non frequentanti devono contattare il docente per concordare il progetto d'esame.

Modalità di esame

L'esame consisterà in un progetto da concordare con l'insegnante e una prova orale. Il risultato del progetto sarà del codice e una relazione sull'attività (4-10 pagine è l'intervallo di lunghezza tipico).
L'esame orale consisterà nella presentazione e discussione del progetto.

Fonte: ESSETRE e Portale esami