Per riconoscere i tratti linguistici di interesse su un corpus composto da quasi tremila temi e per annotarli in modo coerente si è reso necessario lo sviluppo di diversi strumenti informatici. Tali software appartengono a due tipologie: da un lato, si sono sviluppati alcuni moduli per l'analisi del testo, che in modo automatico riconoscono dei tratti o estraggono delle informazioni parziali utili a riconoscere i tratti in modo manuale. Dall'altro, si è adattata al progetto una piattaforma online che permette di effettuare annotazione linguistica multilivello con diversi annotatori al lavoro in parallelo su porzioni diverse del corpus di temi.
Gli strumenti informatici. Sviluppo e risultati
Tonelli S.
;Sprugnoli R.;Palmero Aprosio;Giovanni Moretti;Stefano Menini
2020-01-01
Abstract
Per riconoscere i tratti linguistici di interesse su un corpus composto da quasi tremila temi e per annotarli in modo coerente si è reso necessario lo sviluppo di diversi strumenti informatici. Tali software appartengono a due tipologie: da un lato, si sono sviluppati alcuni moduli per l'analisi del testo, che in modo automatico riconoscono dei tratti o estraggono delle informazioni parziali utili a riconoscere i tratti in modo manuale. Dall'altro, si è adattata al progetto una piattaforma online che permette di effettuare annotazione linguistica multilivello con diversi annotatori al lavoro in parallelo su porzioni diverse del corpus di temi.I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.