Estimation de la densité du noyau sur les distributions asymétriques

10

Soit observations tirées d'une distribution de probabilité inconnue (mais certainement asymétrique).{X1,,XN}

Je voudrais trouver la distribution de probabilité en utilisant l'approche KDE: Cependant, j'ai essayé d'utiliser un noyau gaussien, mais il a mal fonctionné, car il est symétrique. Ainsi, j'ai vu que certains travaux sur les noyaux Gamma et Beta ont été publiés, même si je ne comprenais pas comment fonctionner avec eux.

F^(X)=1Nhje=1NK(X-Xjeh)

Ma question est: comment gérer ce cas asymétrique, en supposant que le support de la distribution sous-jacente n'est pas dans l'intervalle ?[0,1]

Eleanore
la source
4
Dans le cas de densités proches de lognormal (que je rencontre beaucoup dans certaines applications particulières), je transforme simplement (en prenant des journaux) puis je fais KDE, puis je retransforme le KDE (vous devez vous rappeler le jacobien lors de la transformation le devis en retour). Cela fonctionne assez bien dans ce cas.
Glen_b -Reinstate Monica
@Glen_b avez-vous une référence ou du matériel où cette méthode est décrite? (Calculer le KDE sur une transformation de la variable d'origine puis transformer le KDE en retour)
boscovich
Pas que je sache - je suis sûr qu'ils existent, car c'est une idée plutôt banale et facile à mettre en œuvre. C'est le genre de chose que j'attendrais d'un étudiant de premier cycle pour pouvoir dériver. En pratique, cela fonctionne très bien.
Glen_b -Reinstate Monica
@glen_b merci. Donc, si je devais l'utiliser dans un rapport / publication technique, pensez-vous qu'il serait acceptable de ne pas donner de références?
Boscovich
1
@guy Il est certainement possible d'avoir des problèmes, en particulier avec certaines transformations et certains types de données. Les situations que j'ai utilisées ont tendance à être assez proches de lognormal, et là, le changement de bande passante que vous voyez comme un problème est exactement ce qui est nécessaire; il fait beaucoup mieux que KDE sur les données brutes. D'après la description du PO, cela semblait assez similaire, mais ce n'est pas comme si je suggérais que c'était une panacée .
Glen_b -Reinstate Monica

Réponses:

5

Tout d'abord, KDE avec des noyaux symétriques peut également très bien fonctionner lorsque vos données sont asymétriques. Sinon, ce serait complètement inutile en pratique.

Deuxièmement, avez-vous envisagé de redimensionner vos données pour corriger l'asymétrie, si vous pensez que cela est à l'origine du problème. Par exemple, il peut être judicieux d'essayer d'aller dans , car cela est connu pour aider dans de nombreux problèmes.Journal(X)

A QUIT - Anony-Mousse
la source
Si vous effectuez une nouvelle mise à l'échelle log(x), devez-vous également tenir compte d'un jacobien?
DilithiumMatrix
0

Hmm. Vous voudrez peut-être une largeur de noyau qui change en fonction de l'emplacement.

Si je regardais le problème dans eCDF, je pourrais essayer de faire une pente numérique du CDF se rapporter à la taille du noyau.

Je pense que si vous allez faire une transformation de coordonnées, alors vous devez avoir une assez bonne idée des points de début et de fin. Si vous connaissez bien la distribution cible, vous n'avez pas besoin de l'approximation du noyau.

EngrStudent
la source
1
Je pourrais très facilement savoir que mes VR ne sont pas négatifs, mais je veux toujours un KDE.
gars