Choisir une bande passante pour les estimateurs de densité du noyau

29

Pour les estimateurs univariés de densité de noyau (KDE), j'utilise la règle de Silverman pour calculer h :

0.9min(sd,IQR/1.34)×n0.2

Quelles sont les règles standard pour KDE multivarié (en supposant un noyau normal).

csgillespie
la source

Réponses:

20

Pour un KDE univarié, il vaut mieux utiliser autre chose que la règle de Silverman qui est basée sur une approximation normale. Une excellente approche est la méthode Sheather-Jones, facilement implémentée dans R; par exemple,

plot(density(precip, bw="SJ"))

La situation du KDE multivarié n'est pas aussi bien étudiée et les outils ne sont pas aussi matures. Plutôt qu'une bande passante, vous avez besoin d'une matrice de bande passante. Pour simplifier le problème, la plupart des gens supposent une matrice diagonale, bien que cela ne conduise pas aux meilleurs résultats. Le paquetage ks dans R fournit des outils très utiles, notamment autorisant une matrice de bande passante complète (pas nécessairement diagonale).

Rob Hyndman
la source
3

Pour une estimation de densité de noyau univariée, la bande passante peut être estimée par la règle de référence normale ou la méthode de validation croisée ou l'approche plug-in.

Pour l'estimation de la densité du noyau multivariée, une méthode de sélection de la bande passante bayésienne peut être utilisée, voir Zhang, X., ML King et RJ Hyndman (2006), Une approche bayésienne de la sélection de la bande passante pour l'estimation de la densité du noyau multivariée, Computational Statistics and Data Analysis, 50, 3009-3031

Gabriel
la source