Assegno di ricerca presso ILC

L’istituto di Linguistica Computazionale “A.Zampolli” del CNR sta cercando un Assegnista di ricerca da inserire nel progetto H2020 TRIPLE (https://project.gotriple.eu/) (ottobre 2019-marzo 2023). Il progetto è coordinato dal CNRS e vede la partecipazione di 19 partner.

Il tema dell’assegno è “Acquisizione di documentazione scientifica da aggregatori per il settore SSH, elaborazione automatica ed integrazione dei dati acquisiti: estrazione di termini, procedure di classificazione e sommarizzazione automatica mediante approcci di Intelligenza Artificiale”.

Le attività comprendono:
– collaborare allo sviluppo, in Java su piattaforma Apache Camel, della pipeline di acquisizione dati (principalmente pubblicazioni scientifiche e progetti di ricerca) e arricchimento semantico (traduzione, classificazione) da aggregatori (OpenAIRE, Isidore, repository che espongono endpoint OAI-PMH etc).
– collaborare all’elaborazione del sistema automatico di classificazione dei documenti (sviluppo su Python + Keras, word embedding, TF-IDF, BERT, varie tecniche di machine learning e di NLP, etc).
Il lavoro prevede una stretta interazione con i partner del progetto, in particolare l’azienda Net7 srl, con sede a Pisa, e CNRS Huma-num.

La durata è di un anno e l’importo di 19.367,00€.

Il profilo ricercato è di un neolaureato (laurea Magistrale) interessato a lavorare in ambito di ricerca.