En lisant l'article "Prévision à grande échelle" (outil de prévision FBProphet, voir https://peerj.com/preprints/3190.pdf ), je suis tombé sur le terme "clairsemé avant". Les auteurs expliquent qu'ils utilisaient un tel "a priori clairsemé" pour modéliser un vecteur d'écarts de taux rapport à un certain taux scalaire , qui est un paramètre de modèle dans le modèle de croissance logistique.
Comme ils déclarent que , est-ce que je comprends bien que "clairsemé" se réfère au vecteur portant des éléments proches de zéro, si le paramètre était petit? Je suis confus, car je pensais que tous les éléments vectoriels devaient être des paramètres de la régression, mais les définir ainsi ne laisse que les paramètres et comme paramètres de modèle libre, n'est-ce pas?
Aussi, est-ce que l'utilisation de la distribution de Laplace pour générer le commun antérieur? Je ne comprends pas pourquoi elle est préférée par exemple à une distribution normale.
la source
Réponses:
Les données éparses sont des données contenant de nombreux zéros. Ici, les auteurs semblent qualifier le prieur de clairsemé car il préfère les zéros. C'est assez explicite si vous regardez la forme de la distribution de Laplace (alias double exponentielle), qui atteint un pic autour de zéro.
(source image Tibshirani, 1996)
Pour cette raison, Laplace prior est souvent utilisé comme a priori robuste , ayant l'effet de régularisation. Cela dit, la priorité de Laplace est un choix populaire, mais si vous voulez des solutions vraiment rares, il peut y avoir de meilleurs choix, comme décrit par Van Erp et al (2019).
Van Erp, S., Oberski, DL et Mulder, J. (2019). Prieurs de retrait pour la régression bayésienne pénalisée. Journal of Mathematical Psychology, 89 , 31-50. doi: 10.1016 / j.jmp.2018.12.004
la source