Valeur attendue de la statistique de commande minimale d'un échantillon normal

9

MISE À JOUR 25 janvier 2014: l'erreur est maintenant corrigée. Veuillez ignorer les valeurs calculées de la valeur attendue dans l'image téléchargée - elles sont erronées - je ne supprime pas l'image car elle a généré une réponse à cette question.

MISE À JOUR 10 janvier 2014: l'erreur a été trouvée - une faute de frappe mathématique dans l'une des sources utilisées. Préparation de la correction ...

La densité de la statistique d'ordre minimum d'une collection de iid variables aléatoires continues avec cdf F_X (x) et pdf f_X (x) est f_ {X _ {(1)}} (x _ {(1)}) = nf_X (x_ {(1)}) \ gauche [1-F_X (x _ {(1)}) \ droite] ^ {n-1} \ qquad [1]nFX(x)fX(x)

fX(1)(x(1))=nfX(x(1))[1FX(x(1))]n1[1]

Si ces variables aléatoires sont normales normales, alors

fX(1)(x(1))=nϕ(x(1))[1Φ(x(1))]n1=nϕ(x(1))[Φ(x(1))]n1[2]
et donc sa valeur attendue est
E(X(1))=nx(1)ϕ(x(1))[Φ(x(1))]n1dx(1)[3]

où nous avons utilisé les propriétés symétriques de la normale standard. Dans Owen 1980 , p.402, éq. [ N, 011 ] nous constatons que

zϕ(z)[Φ(az)]mdz=am(a2+1)(2π)ϕ(z)[Φ(aza2+1)]m1dz[4]

Correspondance des paramètres entre les équations [3] et [4] ( a=1 , m=n1 ) que nous obtenons

E(X(1))=n(n1)2πϕ(x(1))[Φ(x(1)2)]n2dx(1)[5]

Toujours dans Owen 1980, p. 409, eq [ n0,010.2 ] nous constatons que

[i=1mΦ(hidiz1di2)]ϕ(z)dz=Zm(h1,...,hm;{ρij})[6]

où est la normale multivariée standard, est les coefficients de corrélation par paire et .Zm()ρij=didj,ij1di1

En faisant correspondre et nous avons, , et [5][6]m=n2hi=0,i

di1di2=12di=±13iρij=ρ=1/3

En utilisant ces résultats, eq devient[5]

E(X(1))=n(n1)2πZn2(0,...,0;ρ=1/3)[7]

Cette intégrale de probabilité normale standard multivaririée de variables équi-corrélées, toutes évaluées à zéro , a fait l'objet de suffisamment de recherches, et diverses méthodes pour l'approcher et la calculer ont été dérivées. Un examen approfondi (lié au calcul des intégrales de probabilités normales multivariées en général) est Gupta (1963) . Gupta fournit des valeurs explicites pour divers coefficients de corrélation et pour un maximum de 12 variables (il couvre donc une collection de 14 variables). Les résultats sont (LA DERNIÈRE COLONNE EST FAUX) :

entrez la description de l'image ici

Maintenant, si nous représentons graphiquement comment la valeur de change avec , nous obtiendronsZn2(0,...,0;ρ=1/3)n

entrez la description de l'image ici

J'arrive donc à mes trois questions / demandes:
1) Quelqu'un pourrait-il vérifier analytiquement et / ou vérifier par simulation que les résultats pour la valeur attendue sont corrects (c'est-à-dire vérifier la validité de l'eq )?[7]

2) En supposant que l'approche est correcte, quelqu'un pourrait-il donner la solution pour les normales avec une variance moyenne et non unitaire non nulle? Avec toutes les transformations, je me sens vraiment étourdi.

3) La valeur de l'intégrale de probabilité semble évoluer en douceur. Que diriez-vous de l'approcher avec une fonction de ?n

Alecos Papadopoulos
la source

Réponses:

6

Vos résultats ne semblent pas corrects. Ceci est facile à voir, sans aucun calcul, car dans votre tableau, votre augmente avec la taille de l'échantillon ; de toute évidence, la valeur attendue du minimum de l'échantillon doit devenir plus petite (c'est-à-dire devenir plus négative) à mesure que la taille de l'échantillon augmente.E[X(1)] nn

Le problème est conceptuellement assez facile.

En bref: si ~ avec pdf :XN(0,1)f(x)

entrez la description de l'image ici

... alors le pdf de la statistique du 1er ordre (dans un échantillon de taille ) est:n

entrez la description de l'image ici

... obtenu ici en utilisant la OrderStatfonction in mathStatica, avec domaine de support:

entrez la description de l'image ici

Alors, , pour peut être facilement obtenu exactement comme:E[X(1)]n=1,2,3

entrez la description de l'image ici

Le cas exact est d'environ , ce qui est évidemment différent de vos travaux de -1,06 (ligne 1 de votre tableau), il semble donc clair que quelque chose ne va pas avec vos travaux (ou peut-être ma compréhension de ce que vous cherchez) .n=30.846284

Pour , l'obtention de solutions de forme fermée est plus délicate, mais même si l'intégration symbolique s'avère difficile, nous pouvons toujours utiliser l'intégration numérique (avec une précision arbitraire si vous le souhaitez). C'est vraiment très facile ... ici, par exemple, est , pour la taille d'échantillon à 14, en utilisant Mathematica :n4E[X(1)]n=1

 sol = Table[NIntegrate[x g, {x, -Infinity, Infinity}], {n, 1, 14}]

{0., -0.56419, -0.846284, -1.02938, -1.16296, -1.26721, -1.35218, -1.4236, -1.48501, -1.53875, -1.58644, -1.62923, -1.66799, -1.70338}

Terminé. Ces valeurs sont évidemment très différentes de celles de votre tableau (colonne de droite).

Pour considérer le cas plus général d'un parent , procédez exactement comme ci-dessus, en commençant par le pdf Normal normal.N(μ,σ2)

Wolfies
la source
Merci d'avoir répondu. En effet, j'ai trop remarqué que quelque chose ne va pas avec les résultats numériques - après tout, la valeur attendue devrait augmenter en taille absolue, plutôt que diminuer, car augmente. J'ai laissé la réponse telle quelle, pour voir si je pouvais avoir un aperçu de n'importe quelle réponse. Je cherche toujours au niveau théorique où est exactement l'erreur, le suspect étant la première équation que j'utilise d'Owen (car la seconde a été vérifiée par d'autres sources) ... au fait, pourriez-vous vérifier si cet eq dans mon message (en tant que transformation autonome) est correct? Je vous serais reconnaissant. n4
Alecos Papadopoulos