Distribution d'échantillonnage du rayon de la distribution normale 2D

11

La distribution normale bivariée avec la moyenne et la matrice de covariance peut être réécrite en coordonnées polaires de rayon et d'angle . Ma question est la suivante: quelle est la distribution d'échantillonnage de , c'est-à-dire de la distance d'un point au centre estimé étant donné la matrice de covariance échantillon ?Σ r θ r x ˉ x SμΣrθr^xx¯S

Contexte: La vraie distance d'un point à la moyenne suit une distribution de Hoyt . Avec les valeurs propres de et , son paramètre de forme est , et son paramètre d'échelle est . La fonction de distribution cumulative est connue pour être la différence symétrique entre deux fonctions Q de Marcum.x μ λ 1 , λ 2 Σ λ 1 > λ 2 q = 1rxμλ1,λ2Σλ1>λ2 ω=λ1+λ2q=1(λ1+λ2)/λ2)1ω=λ1+λ2

La simulation suggère que le branchement des estimations et pour et dans le vrai cdf fonctionne pour les grands échantillons, mais pas pour les petits échantillons. Le diagramme suivant montre les résultats de 200 fois SμΣx¯SμΣ

  • simulant 20 vecteurs normaux 2D pour chaque combinaison de ( axe ), (lignes) et quantile (colonnes) donnésx ωqxω
  • pour chaque échantillon, calculer le quantile donné du rayon observé à ˉ xr^x¯
  • pour chaque échantillon, en calculant le quantile de la Hoyt théorique (2D normal) fonction de répartition, et à partir de la fonction de répartition de Rayleigh théoriques après avoir branché les estimations de l' échantillon et . Sx¯S

entrez la description de l'image ici

Lorsque s'approche de 1 (la distribution devient circulaire), les quantiles de Hoyt estimés se rapprochent des quantiles de Rayleigh estimés qui ne sont pas affectés par . Au fur et à mesure que grandit, la différence entre les quantiles empiriques et les quantiles estimés augmente, notamment dans la queue de la distribution.q ωqqω

caracal
la source
1
Quelle est la question?
John
@John I a mis en évidence la question: "Quelle est la distribution d'échantillonnage de [rayon] , c'est-à-dire de la distance d'un point au centre estimé compte tenu de la matrice de convariance échantillon ?" rxx¯S
caracal
Pourquoi par opposition à ? r^r2^
SomeEE
@MathEE simplement parce que la littérature que je connais concerne la distribution de (vrai) , pas (vrai) . Notez que cela n'est pas le cas avec la distance de Mahalanobis discutée dans cette question . Bien sûr, les résultats pour la distribution de seraient les bienvenus. r^rr2r^2
caracal

Réponses:

7

Comme vous l'avez mentionné dans votre article, nous connaissons la distribution de l'estimation de si on nous donne , nous connaissons donc la distribution de l'estimation du vrai .rtrue^μrtrue2^r2

Nous voulons trouver la distribution de où sont exprimés sous forme de vecteurs de colonne.

r2^=1Ni=1N(xix¯)T(xix¯)
xi

Nous faisons maintenant l'astuce standard

rtrue2^=1Ni=1N(xiμ)T(xiμ)=1Ni=1N(xix¯+x¯μ)T(xix¯+x¯μ)=[1Ni=1N(xix¯)T(xix¯)]+(x¯μ)T(x¯μ)(1)=r2^+(x¯μ)T(x¯μ)
où résulte de l'équation et sa transposition.(1)
1Ni=1N(xix¯)T(x¯μ)=(x¯x¯)T(x¯μ)=0

Notez que est la trace de la matrice de covariance échantillon et ne dépend que de la moyenne de l'échantillon . Ainsi, nous avons écrit comme la somme de deux variables aléatoires indépendantes. Nous connaissons les distributions des et et nous avons donc terminé via l'astuce standard en utilisant cela les fonctions caractéristiques sont multiplicatives. S( ¯ x -μ)T( ¯ x -μ) ¯ x ^ r 2r2^S(x¯μ)T(x¯μ)x¯

rtrue2^=r2^+(x¯μ)T(x¯μ)
rtrue2^(x¯μ)T(x¯μ)

Modifié pour ajouter:

||xiμ||est Hoyt donc il a pdf où est la fonction Bessel modifiée du premier type .

f(ρ)=1+q2qωρe(1+q2)24q2ωρ2IO(1q44q2ωρ2)
I00th

Cela signifie que le pdf de est ||xiμ||2

f(ρ)=121+q2qωe(1+q2)24q2ωρI0(1q44q2ωρ).

Pour faciliter la notation, définissez , et .a=1q44q2ωb=(1+q2)24q2ωc=121+q2qω

La fonction de génération de moment de est ||xiμ||2

{c(sb)2a2(sb)>a0 else

Ainsi, la fonction de génération de moment de est et la fonction de génération de moment de est rtrue2^

{cN((s/Nb)2a2)N/2(s/Nb)>a0else
||x¯μ||2
{Nc(sNb)2(Na)2=c(s/Nb)2a2(s/Nb)>a0 else

Cela implique que la fonction de génération de moment de est r2^

{cN1((s/Nb)2a2)(N1)/2(s/Nb)>a0 else.

L'application de la transformée de Laplace inverse donne que a pdf r2^

g(ρ)=πNcN1Γ(N12)(2iaNρ)(2N)/2ebNρJN/21(iaNρ).
SomeEE
la source
Je vous remercie! Je vais devoir travailler sur les détails avant d'accepter.
caracal
rtrue2^Hoyt , et ? Alors la fonction caractéristique de est le produit des deux fonctions caractéristiques comme expliqué ici . Cela répond en effet à ma question. Savez-vous comment transformer convenablement telle sorte que sa distribution soit connue sans accès à ? Comme la distance de Mahalanobis ou la statistique univariée ? ||x¯μ||2N(0,1NΣ)r2^r2^Σt
caracal
J'ai modifié ma réponse en une réponse complète. Veuillez me faire savoir si vous êtes d'accord.
SomeEE
Je ne suis pas sûr de unknown . La chose évidente à faire serait d'essayer de "diviser" par la covariance d'échantillon qui ressemblerait à une somme des distances de Mahalanobis, c'est-à-dire considérer . Malheureusement, cette somme est toujours de . Σr2^S1Ni=1N(xix¯)TS1(xix¯)1
SomeEE
Merci de continuer à travailler sur la réponse! Je ne suis pas sûr de la distribution de . Je ne suis pas en mesure de faire face à cette analytiquement, mais une simulation rapide de donne une autre distribution que : code de simulation de R . Bien qu'il se pourrait bien que je ne comprenne pas correctement la paramétrisation . r 2 Γ ( q , ω||xiμ||2r2ΓΓ(q,ωq)Γ
caracal