La distribution normale bivariée avec la moyenne et la matrice de covariance peut être réécrite en coordonnées polaires de rayon et d'angle . Ma question est la suivante: quelle est la distribution d'échantillonnage de , c'est-à-dire de la distance d'un point au centre estimé étant donné la matrice de covariance échantillon ?Σ r θ r x ˉ x S
Contexte: La vraie distance d'un point à la moyenne suit une distribution de Hoyt . Avec les valeurs propres de et , son paramètre de forme est , et son paramètre d'échelle est . La fonction de distribution cumulative est connue pour être la différence symétrique entre deux fonctions Q de Marcum.x μ λ 1 , λ 2 Σ λ 1 > λ 2 q = 1 ω=λ1+λ2
La simulation suggère que le branchement des estimations et pour et dans le vrai cdf fonctionne pour les grands échantillons, mais pas pour les petits échantillons. Le diagramme suivant montre les résultats de 200 fois SμΣ
- simulant 20 vecteurs normaux 2D pour chaque combinaison de ( axe ), (lignes) et quantile (colonnes) donnésx ω
- pour chaque échantillon, calculer le quantile donné du rayon observé à ˉ x
- pour chaque échantillon, en calculant le quantile de la Hoyt théorique (2D normal) fonction de répartition, et à partir de la fonction de répartition de Rayleigh théoriques après avoir branché les estimations de l' échantillon et . S
Lorsque s'approche de 1 (la distribution devient circulaire), les quantiles de Hoyt estimés se rapprochent des quantiles de Rayleigh estimés qui ne sont pas affectés par . Au fur et à mesure que grandit, la différence entre les quantiles empiriques et les quantiles estimés augmente, notamment dans la queue de la distribution.q ω
Réponses:
Comme vous l'avez mentionné dans votre article, nous connaissons la distribution de l'estimation de si on nous donne , nous connaissons donc la distribution de l'estimation du vrai .rtrueˆ μ r2trueˆ r2
Nous voulons trouver la distribution de où sont exprimés sous forme de vecteurs de colonne.
Nous faisons maintenant l'astuce standard
Notez que est la trace de la matrice de covariance échantillon et ne dépend que de la moyenne de l'échantillon . Ainsi, nous avons écrit comme la somme de deux variables aléatoires indépendantes. Nous connaissons les distributions des et et nous avons donc terminé via l'astuce standard en utilisant cela les fonctions caractéristiques sont multiplicatives. S( ¯ x -μ)T( ¯ x -μ) ¯ x ^ r 2r2ˆ S (x¯¯¯−μ)T(x¯¯¯−μ) x¯¯¯
Modifié pour ajouter:
Cela signifie que le pdf de est||xi−μ||2
Pour faciliter la notation, définissez , et .a=1−q44q2ω b=−(1+q2)24q2ω c=121+q2qω
La fonction de génération de moment de est||xi−μ||2
Ainsi, la fonction de génération de moment de est et la fonction de génération de moment de estr2trueˆ
Cela implique que la fonction de génération de moment de estr2ˆ
L'application de la transformée de Laplace inverse donne que a pdfr2ˆ
la source