Il lavoro ha riguardato la valutazione sperimentale di algoritmi per l`ordinamento in termini di rilevanza di documenti web relativi a particolari categorie tematiche. In particolare, ci si è focalizzati su un algoritmo che utilizza tecniche di machine learning per determinate la rilevanza basandosi su preferenza binarie espresse da esperti del dominio su un insieme ristretto di coppie di documenti. E` stato realizzato un sistema software accessibile via web, utilizzato per collezionare il feedback di un gruppo di utenti sulla qualità degli ordinamenti ottenuti, usando i diversi algoritmi, per ricerche sulle varie categorie. I risultati ottenuti mostrano come, a differenza degli altri approcci, l`algoritmo basato su machine learning si comporta in maniera uniforme sulle quattro categorie, mantenento una notevole precisione
Valutazione sperimentale di tecniche per la prioritizzazione di informazione tematica
Tonazzolli, Matteo
2005-01-01
Abstract
Il lavoro ha riguardato la valutazione sperimentale di algoritmi per l`ordinamento in termini di rilevanza di documenti web relativi a particolari categorie tematiche. In particolare, ci si è focalizzati su un algoritmo che utilizza tecniche di machine learning per determinate la rilevanza basandosi su preferenza binarie espresse da esperti del dominio su un insieme ristretto di coppie di documenti. E` stato realizzato un sistema software accessibile via web, utilizzato per collezionare il feedback di un gruppo di utenti sulla qualità degli ordinamenti ottenuti, usando i diversi algoritmi, per ricerche sulle varie categorie. I risultati ottenuti mostrano come, a differenza degli altri approcci, l`algoritmo basato su machine learning si comporta in maniera uniforme sulle quattro categorie, mantenento una notevole precisioneI documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.