À quoi fait référence le terme «a priori clairsemé» (FBProphet Paper)?

11

En lisant l'article "Prévision à grande échelle" (outil de prévision FBProphet, voir https://peerj.com/preprints/3190.pdf ), je suis tombé sur le terme "clairsemé avant". Les auteurs expliquent qu'ils utilisaient un tel "a priori clairsemé" pour modéliser un vecteur d'écarts de taux δ rapport à un certain taux scalaire k , qui est un paramètre de modèle dans le modèle de croissance logistique.

Comme ils déclarent que δjLaplace(0,τ) , est-ce que je comprends bien que "clairsemé" se réfère au vecteur portant des éléments proches de zéro, si le paramètre τ était petit? Je suis confus, car je pensais que tous les éléments vectoriels devaient être des paramètres de la régression, mais les définir ainsi ne laisse que les paramètres k et τ comme paramètres de modèle libre, n'est-ce pas?

Aussi, est-ce que l'utilisation de la distribution de Laplace pour générer le commun antérieur? Je ne comprends pas pourquoi elle est préférée par exemple à une distribution normale.

NargothX
la source
1
Je m'interroge également sur cette question, en lisant le journal. Avez-vous trouvé une réponse à cette question? Aussi, avez-vous posé cette question dans la section des problèmes de github du Prophète ? L'un des auteurs (@bletham) répond très activement aux questions et ses explications sont généralement assez bonnes.
départ

Réponses:

4

Les données éparses sont des données contenant de nombreux zéros. Ici, les auteurs semblent qualifier le prieur de clairsemé car il préfère les zéros. C'est assez explicite si vous regardez la forme de la distribution de Laplace (alias double exponentielle), qui atteint un pic autour de zéro.

(source image Tibshirani, 1996)

τ

Pour cette raison, Laplace prior est souvent utilisé comme a priori robuste , ayant l'effet de régularisation. Cela dit, la priorité de Laplace est un choix populaire, mais si vous voulez des solutions vraiment rares, il peut y avoir de meilleurs choix, comme décrit par Van Erp et al (2019).

Van Erp, S., Oberski, DL et Mulder, J. (2019). Prieurs de retrait pour la régression bayésienne pénalisée. Journal of Mathematical Psychology, 89 , 31-50. doi: 10.1016 / j.jmp.2018.12.004

Tim
la source
3
+1 J'ajouterai simplement que ce sont souvent des prieurs "induisant la rareté", terme que je pense personnellement plus clair (le prieur induit la rareté dans les coefficients de régression estimés)
Jake Westfall