Nell’ambito del progetto FAO ASFA, viene offerto un tirocinio dal titolo: “Preparazione di dati per l’addestramento di riconoscitori automatici del Parlato”.Il progetto FAO ASFA vede la collaborazione di ISTI-CNR e della Organizzazione delle Nazioni Unite per l’alimentazione e l’agricoltura (FAO)
Oggetto del tirocinio:
Preparazione dei dati del corpus vocale annotato APASCI allo scopo di addestrare due riconoscitori automatici del parlato ad architetture Hidden Markov Model + Gaussian Mixture Models ed Hidden Markov Model + Deep Neural Networks. Il tirocinante avrà il compito di elaborare i dati audio-testuali del corpus e di predisporli per l’applicazione di script del CNR, per l’addestramento dei modelli acustici e del linguaggio dei riconoscitori vocali selezionati. Le tecnologie utilizzare si baseranno su architetture standard e software stato dell’arte, quali CMU Sphinx e KALDI. Il prodotto sarà poi inserito nell’infrastruttura Open Science D4Science dell’ISTI-CNR per renderlo fruibile via Web service.
L’esperienza formativa prevista al termine del tirocinio consisterà è riassumibile nei seguenti punti:
1- Preparazione dati di addestramento di riconoscitori vocali stato dell’arte;
2- Addestramento di due sistemi stato dell’arte per il riconoscimento vocale;
3- Uso di una infrastruttura digitale orientata al paradigma Open Science.
Requisiti:
Esperienza in almeno un linguaggio di programmazione per la preparazione dei dati, ad es. Java, Python, R, Matlab o altro.
Per info e candidature, contattare il dottor Gianpaolo Coro.