Questo lavoro si propone due scopi principali: il primo è la raccolta di un corpus di frasi progettate per studiare come la prosodia possa aiutare nella disambiguazione sintattico - semantica, il secondo è l’integrazione di tale informazione in un riconoscitore vocale. Sono stati progettati, acquisiti ed etichettati diversi insiemi di frasi, strutturati in modo da evidenziare alcuni usi della prosodia nel linguaggio umano. I dati raccolti si possono dividere in due categorie principali: frasi di senso compiuto e serie di numeri e cifre, entrambi caratterizzati da elevata ambiguità semantica. Gli esperimenti condotti sono relativi alla disambiguazione di sequenze di numeri (ad es. 107 100 vs. 100 700). In particolare abbiamo elaborato sequenze di numeri utilizzando il riconoscitore ITC-irst, coadiuvato o meno da informazione prosodica. Gli effetti dell’elaborazione prosodica sono più che apprezzabili e, almeno nel problema della disambiguazione numerica, consentono di dimezzare l’errore di riconoscimento.
Uso della prosodia per la disambiguazione di sequenze di numeri
Gretter, Roberto;Seppi, Dino
2004-01-01
Abstract
Questo lavoro si propone due scopi principali: il primo è la raccolta di un corpus di frasi progettate per studiare come la prosodia possa aiutare nella disambiguazione sintattico - semantica, il secondo è l’integrazione di tale informazione in un riconoscitore vocale. Sono stati progettati, acquisiti ed etichettati diversi insiemi di frasi, strutturati in modo da evidenziare alcuni usi della prosodia nel linguaggio umano. I dati raccolti si possono dividere in due categorie principali: frasi di senso compiuto e serie di numeri e cifre, entrambi caratterizzati da elevata ambiguità semantica. Gli esperimenti condotti sono relativi alla disambiguazione di sequenze di numeri (ad es. 107 100 vs. 100 700). In particolare abbiamo elaborato sequenze di numeri utilizzando il riconoscitore ITC-irst, coadiuvato o meno da informazione prosodica. Gli effetti dell’elaborazione prosodica sono più che apprezzabili e, almeno nel problema della disambiguazione numerica, consentono di dimezzare l’errore di riconoscimento.I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.