Gli algoritmi boosting costituiscono una delle principali novità nella costruzione di modelli predittivi di classificazione e regressione e forse una piccola rivoluzione per il data mining statistico. In questo articolo seguiamo una recente interpretazione degli algoritmi di boosting come approssimazioni greedy in spazi funzionali. Questo approccio ci ha permesso di sviluppare un nuovo metodo numerico per la costruzione automatica di panel di serie temporali. Il metodo è particolarmente adatto per la realizzazione di stime in tempo reale e in situazioni di rapido mutamento che rendono difficile definire un campione in termini di sottoclassi omogenee. Come prima applicazione, è stato realizzato un modello boosting per la stima in tempo reale delle presenze alberghiere totali in provincia di Trento. Con un panel di 20 esercizi su più di 1700 è possibile stimare la presenza totale con un errore predittivo inferiore all'1% (stime estate 1999). L'estrazione degli elementi del panel e la definizione dei loro pesi dipende solo dal contributo alla ricostruzione della serire totale di presenza sulla base di dati storici: le serie selezionate sembrano corrispondere a tipologie base di comportamento, ed il metodo di selezione automatica permette di ricalibrare il modello nei casi di non risposta a abbandono. Le stime sono utilizzabili in tempo reale per mezzo di un server statistico che include procedure di adattamento del panel alle variazioni tra stagioni

Algoritmi boosting e applicazioni alla selezione automatica di panel

Furlanello, Cesare;Visentin, Marco
2000-01-01

Abstract

Gli algoritmi boosting costituiscono una delle principali novità nella costruzione di modelli predittivi di classificazione e regressione e forse una piccola rivoluzione per il data mining statistico. In questo articolo seguiamo una recente interpretazione degli algoritmi di boosting come approssimazioni greedy in spazi funzionali. Questo approccio ci ha permesso di sviluppare un nuovo metodo numerico per la costruzione automatica di panel di serie temporali. Il metodo è particolarmente adatto per la realizzazione di stime in tempo reale e in situazioni di rapido mutamento che rendono difficile definire un campione in termini di sottoclassi omogenee. Come prima applicazione, è stato realizzato un modello boosting per la stima in tempo reale delle presenze alberghiere totali in provincia di Trento. Con un panel di 20 esercizi su più di 1700 è possibile stimare la presenza totale con un errore predittivo inferiore all'1% (stime estate 1999). L'estrazione degli elementi del panel e la definizione dei loro pesi dipende solo dal contributo alla ricostruzione della serire totale di presenza sulla base di dati storici: le serie selezionate sembrano corrispondere a tipologie base di comportamento, ed il metodo di selezione automatica permette di ricalibrare il modello nei casi di non risposta a abbandono. Le stime sono utilizzabili in tempo reale per mezzo di un server statistico che include procedure di adattamento del panel alle variazioni tra stagioni
File in questo prodotto:
Non ci sono file associati a questo prodotto.

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11582/34
 Attenzione

Attenzione! I dati visualizzati non sono stati sottoposti a validazione da parte dell'ateneo

Citazioni
  • ???jsp.display-item.citation.pmc??? ND
social impact