Borsa di dottorato in Linguistica Computazionale

È aperto il bando di concorso per una borsa a tematica  vincolata in Linguistica Computazionale finanziata dal MUR nell’ambito del PON Innovazione presso il Dottorato in Discipline Linguistiche e Letterature Straniere (curriculum linguistico) dell’Università dei Pisa.
Il tema della borsa è: Sviluppo di applicazioni per l’analisi semantica e l’accesso intelligente ai documenti della Pubblica Amministrazione con tecniche di linguistica computazionale basate su Neural Language Models

Descrizione del tema di ricerca:
La tematica dottorale ha come obiettivo la realizzazione e la sperimentazione di un framework di Linguistica Computazionale e Intelligenza Artificiale per l’analisi semantica di documenti della Pubblica Amministrazione (PA) in collaborazione con la ditta partner 01Semplice srl. Alla base dell’architettura ci sarà la creazione di un Neural Language Model basato su Transformers, addestrato e specializzato su corpora di riferimento per il dominio della PA o del linguaggio burocratico in generale (documenti amministrativi, bancari, assicurativi, legali ecc.). Gli algoritmi di Deep Learning per la costruzione del Language Model apprendono un modello probabilistico della lingua, utile per lo sviluppo di diversi strumenti di Information Extraction. Tali strumenti, a partire dalla conoscenza linguistica contenuta nel Language Model, saranno specializzati per risolvere compiti particolari, come per esempio la classificazione di documenti, il Question/Answering, il riconoscimento di entità e relazioni semantiche, ecc. Grazie al connubio tra Neural Language Model generale e metodi di transfer learning (es. fine-tuning, few-shot learning, ecc.) a fronte di un task o di un dominio nuovo, il framework sarà in grado di verticalizzarsi su di esso con elevata flessibilità, adattabilità e rapidità, riducendo drasticamente i tempi della fase di addestramento e al contempo l’impiego di risorse esperte nell’ambito del dominio o dell’Intelligenza Artificiale (domain/AI expertise), mantenendo al tempo stesso una qualità elevata delle prestazioni. Questo permetterà lo sviluppo di servizi innovativi per la PA e l’accesso intelligente al suo patrimonio documentale. Durante il suo periodo di formazione e ricerca, il Dottorando approfondirà lo stato dell’arte della linguistica computazionale e dei modelli neurali; curerà l’addestramento del Neural Language Model; lo applicherà a vari task semantici per sviluppare applicazioni che verranno integrate in un sistema di gestione documentale industrializzato da 01Semplce srl, in collaborazione con il Laboratorio di Linguistica Computazionale del Prof. Alessandro Lenci (supervisore del progetto) presso il Dipartimento di Filologia Letteratura e Linguistica. Queste applicazioni favoriranno la Trasformazione Digitale della PA, ponendosi come architrave per nuovi modelli organizzativi e processi lavorativi, che mettano al centro la reale disponibilità dei dati ed il valore strategico della conoscenza.”

Supervisore dottorale: Alessandro Lenci

NB: La scadenza del bando è molto ravvicinata: 15 ottobre
La borsa prevede anche uno stage obbligatorio di 6 mesi presso la ditta 01Semplice srl, che si occupa di strumenti per l’analisi semantica dei documenti della PA, e un periodo di formazione di 8 mesi all’estero.
Chi fosse interessato può trovare maggior informazioni su questo sito: https://dottorato.unipi.it/index.php/it/concorsi-d-ammissione-a-a-2021-2022/item/615.html  e può contattare Alessandro Lenci: alessandro.lenci@unipi.it