Cette question est motivée par une discussion ailleurs .
Les noyaux variables sont souvent utilisés dans la régression locale. Par exemple, le loess est largement utilisé et fonctionne bien comme un régulateur de régression, et est basé sur un noyau de largeur variable qui s'adapte à la rareté des données.
D'un autre côté, on pense généralement que les noyaux variables conduisent à de mauvais estimateurs dans l'estimation de la densité du noyau (voir Terrell et Scott, 1992 ).
Y a-t-il une raison intuitive pour laquelle ils fonctionneraient bien pour la régression mais pas pour l'estimation de la densité?
nonparametric
smoothing
kernel-smoothing
loess
Rob Hyndman
la source
la source
Réponses:
Il semble y avoir deux questions différentes ici, que je vais essayer de diviser:
1) en quoi KS, lissage du noyau, différent de KDE, estimation de la densité du noyau? Eh bien, disons que j'ai un estimateur / plus lisse / interpolateur
et il arrive aussi de connaître la "vraie" densité f () au xi. L'exécution
est( x, densityf )
doit alors donner une estimation de la densité f (): un KDE. Il se pourrait bien que les KS et les KDE soient évalués différemment - différents critères de lissage, différentes normes - mais je ne vois pas de différence fondamentale. Qu'est-ce que je rate ?2) Comment la dimension affecte- t-elle intuitivement l' estimation ou le lissage ? Voici un exemple de jouet, juste pour aider l'intuition. Considérons une boîte de N = 10000 points dans une grille uniforme et une fenêtre, une ligne ou un carré ou un cube, de W = 64 points à l'intérieur:
Ici, le «rapport latéral» est le côté fenêtre / côté boîte, et «dist to win» est une estimation approximative de la distance moyenne d'un point aléatoire dans la boîte à une fenêtre placée au hasard.
Est-ce que cela a un sens? (Une image ou une applet aiderait vraiment: n'importe qui?)
L'idée est qu'une fenêtre de taille fixe dans une boîte de taille fixe a une proximité très différente du reste de la boîte, en 1d 2d 3d 4d. C'est pour une grille uniforme; peut-être que la forte dépendance à l'égard de la dimension se répercute sur d'autres distributions, peut-être pas. Quoi qu'il en soit, cela ressemble à un fort effet général, un aspect de la malédiction de la dimensionnalité.
la source
L'estimation de la densité du noyau signifie l' intégration sur une fenêtre locale (floue), et le lissage du noyau signifie la moyenne sur une fenêtre locale (floue).
Comment sont-ils les mêmes?
Considérons des échantillons d'une fonction à valeur booléenne, c'est-à-dire un ensemble contenant à la fois des "vrais échantillons" (chacun avec une valeur unitaire) et des "faux échantillons" (chacun avec une valeur nulle). En supposant que la densité globale de l'échantillon est constante (comme une grille), la moyenne locale de cette fonction est identiquement proportionnelle à la densité locale (partielle) du sous-ensemble à valeur réelle. (Les faux échantillons nous permettent d'ignorer constamment le dénominateur de l'équation de lissage, tout en ajoutant zéro terme à la sommation, de sorte qu'il se simplifie dans l'équation d'estimation de la densité.)
De même, si vos échantillons étaient représentés comme des éléments clairsemés sur un raster booléen, vous pouvez estimer leur densité en appliquant un filtre de flou au raster.
En quoi sont-ils différents?
Intuitivement, vous pouvez vous attendre à ce que le choix de l'algorithme de lissage dépende du fait que les mesures de l'échantillon contiennent ou non une erreur de mesure significative.
À un extrême (pas de bruit), il vous suffit d'interpoler entre les valeurs exactement connues aux emplacements des échantillons. Disons, par triangulation de Delaunay (avec interpolation bilinéaire par morceaux).
L'estimation de la densité ressemble à l'extrême opposé, elle est entièrement sonore, car l'échantillon isolé n'est pas accompagné d'une mesure de la valeur de densité à ce point. (Il n'y a donc rien à interpoler simplement. Vous pourriez envisager de mesurer les zones de cellules du diagramme de Voronoï, mais le lissage / débruitage sera toujours important ..)
Le fait est que, malgré la similitude, il s'agit de problèmes fondamentalement différents, de sorte que différentes approches peuvent être optimales.
la source