Existe-t-il des concepts ou des théories statistiques sur la façon de mesurer efficacement la récence dans laquelle les événements récents ont plus de poids que les événements plus anciens. Je crée un modèle de régression logistique et je voudrais appliquer un ajustement à divers facteurs en fonction de la récence des événements.
... ou, est-ce à moi de trouver une formule arbitraire?
Par exemple: Un de mes projets consiste à prédire par régression logistique les performances des golfeurs professionnels dans les tournois à venir. Leur forme récente (comment ils ont joué la semaine dernière) est généralement plus importante que la façon dont ils ont joué il y a six mois. Existe-t-il des techniques / approches spécifiques qui exploitent ce concept?
la source
Réponses:
Cela ne doit pas nécessairement être arbitraire; vous pouvez, par exemple, supposer une actualisation exponentielle et rechercher le coefficient qui a la meilleure valeur prédictive.
Autrement dit, au temps vous pourriez dire que le poids, ou de manière équivalente (où et ).t wt−k∝pk wt−k∝exp(−αk) 0<p<1 α>0
Dans ce qui précède, ou sont des paramètres libres, mais plutôt que de les choisir arbitrairement, vous pouvez comparer leurs performances prédictives sur différentes valeurs de (ou de manière équivalente, sur différents ), peut-être en comparant des sommes de carrés d'une longueur d'avance les erreurs de prédiction ou tout autre critère (fonction de perte) que vous considérez comme le plus précieux / intéressant / utile.p α p α
Alternativement, vous pouvez utiliser une approche similaire, mais lorsque vous appliquez une autre forme d'actualisation, comme l'actualisation hyperbolique .
la source