Quelle est la distribution du maximum d'une paire de tirages iid, où le minimum est une statistique d'ordre d'autres minima?

8

Considérons tirages indépendants de cdf , qui est défini sur 0-1, où et sont des entiers. Regroupez arbitrairement les tirages en groupes avec m valeurs dans chaque groupe. Regardez la valeur minimale dans chaque groupe. Prenez le groupe qui a le plus grand de ces minima. Maintenant, quelle est la distribution qui définit la valeur maximale dans ce groupe? De manière plus générale, quelle est la distribution pour la la statistique de l' ordre de de tirages de , où l'ordre kième de ces m dessine est aussi l'ordre pième du n tirages de cette statistique de kème ordre?nmF(x)nmnjmF(x)

Tout cela est au plus abstrait, alors voici un exemple plus concret. Considérons 8 tirages de . Groupez-les en 4 paires de 2. Comparez la valeur minimale de chaque paire. Sélectionnez la paire avec le plus élevé de ces 4 minima. Étiquette qui dessine "a". Marquez l'autre valeur de cette même paire comme "b". Quelle est la distribution ? Nous savons . Nous savons que a est le maximum de 4 minimums de , de . Qu'est-ce que ?F(x)Fb(b)b>aF(x)Fa(a)=(1(1F(x))2)4Fb(b)

OctaviaQ
la source
puis-je demander où avez-vous eu ce problème?
Theta30
JandR vous avez supprimé un de vos commentaires dans lequel vous avez indiqué une méthode ad hoc utilisant des poids.
Theta30
oui, je pensais que ce n'était plus pertinent, car vous avez fourni une bien meilleure solution. Je vais voir si je peux trouver ce que j'avais écrit.
OctaviaQ
oui, mais il pourrait y avoir des idées intéressantes
Theta30
Ma méthode de force brute: je pensais que Xfinalserait un mélange de poids prévisibles de statistiques d'ordre de n * m tirages de F (x). Par exemple, pourn=4 et m=2, nous commençons par 8 tirages indépendants de F (x), et Xfinal> la statistique du 4ème ordre. Pour trouver le PR de chaque commande stat 5-8, j'ai écrit un script informatique qui a écrit chaque permutation de 1-8, et un algorithme qui a trouvéXfinalpour chaque permutation (en utilisant les statistiques de commande elles-mêmes comme comparaisons) (suite ...)
OctaviaQ

Réponses:

4

Je réponds à ceci: "Regroupez arbitrairement les tirages en n groupes avec m valeurs dans chaque groupe. Regardez la valeur minimale dans chaque groupe. Prenez le groupe qui a le plus grand de ces minima. Maintenant, quelle est la distribution qui définit la valeur maximale dans ce groupe? "
LaisserXi,j la i-ème variable aléatoire dans le groupe j et F(Xje,j) (F(Xje,j)) sa fonction de densité (cdf).
LaisserXmax,j,Xmin,jle maximum et le minimum dans le groupe . Soit la variable qui résulte à la fin de tout processus. Nous voulons calculer qui est Maintenant, soit et . jXFjenunelP(XFjenunel<X)

P(Xmax,j0<X et Xmin,j0=maxjXmin,j et 1j0n)
=nP(XmuneX,1<X et Xmin,1=maxjXmin,j)
=nmP(X1,1<X et X1,1=maxje(Xje,1) et Xmin,1=maxjXmin,j)
=nmP(X1,1<X,X1,1>X2,1>maxj=2nXmjen,j,,X1,1>Xm,1>maxj=2nXmjen,j)
Oui=maxj=2nXmjen,jW=X1,1

Un rappel: si sont iid avec pdf (cdf) ( ), alors a pdf et a le pdf . En utilisant cela, nous obtenons le pdf de est X1,XnhHXminhmin=nh(1-H)n-1XmaxhmuneX=nhHn-1
Oui

g(y)=(n-1)mF(1-F)m-1[0ymF(z)(1-F(z))m-1z]n-2,n2

Notez que est une statistique indépendante du groupe 1, donc sa densité conjointe avec n'importe quelle variable du groupe 1 est le produit des densités. Maintenant, la probabilité ci-dessus devient En prenant la dérivée de cette intégrale wrt et en utilisant la formule binomiale, nous obtenons le pdf de . Oui

nm0XF(w)[0wywF(X2,1)X2,1ywF(Xm,1)Xm,1g(y)y]w
=nm0XF(w)[0w(F(w)-F(y))m-1g(y)y]w
XXFjenunel

Exemple: est uniforme, , . AlorsXn=4m=3

g(y)=9(1-y)2(3y+y3-3y2)2,

P(XFjenunel<X)=(1/55)X12-(12/55)X11
+(6/5)Xdix-(27/7)X9+(54/7)X8-(324/35)X7+(27/5)X6.

La moyenne de est de et son sd est de .XFjenunel374/455=0,8220,145

Theta30
la source
Merci de votre aide! Mais, lorsque je suis exactement le processus pour des exemples simples (tels que F (x) = x, n = 4, m = 2), le pdf résultant ne s'intègre pas à 1 ou autrement semble raisonnable. Donc, je ne sais pas ce qui ne va pas. Aussi, je ne suis pas clair sur votre g (y). J'ai pensé qu'il faudrait des m: hmin (y) = m * f (y) (1-F (y)) ^ (m-1)  g (y) = (n-1) * hmin (y) * [ Intégrale sur 0 à x de hmin (y)] ^ (n-2) ou, plus simplement, G (y) = (1- (1-F (y)) ^ m) ^ (n-1), g ( y) = G '(y). Mais, même si je le remplace par g (y), le pdf final n'a toujours pas de sens. Suis-je en train d'interpréter quelque chose de mal?
OctaviaQ
@JandR Je l'ai revérifié aujourd'hui; voir les corrections
Theta30
Pour info, j'ai initialement posté cette question dans mathoverflow.net. J'ai posté un lien vers votre réponse ici, mais si vous êtes intéressé à republier ou à relier votre réponse vous-même, la question est ici: lien
OctaviaQ
1

Étant donné que les tirages proviennent d'un échantillon iid, nous pouvons simplement considérer le tirage sélectionné. Considérons . Nous savons maintenant que vient de et que . Donc,F(X)=F(X)XbF(X)b>une

p(b|une)=F(b)une1F(y)yb>une,0 autrement.

Le minimum dans un tirage de deux est m

p2(m)=F(m)m1F(y)y.

Le minimum le plus élevé parmi 4 tirages serait

p(une)=p2(une)[0unep2(z)z]3=F(une)une1F(X)X[0uneF(y)(y1F(z)z)y]3.

Alors finalement,

p(b)=01[u(une)F(b)une1F(y)yF(une)une1F(X)X[0uneF(y)(y1F(z)z)y]3]une.
bande passante élevée
la source
Merci pour l'élaboration. J'essaie de comprendre ça! Deux questions: qu'est-ce que u (a) dans la dernière équation? et, êtes-vous sûr que votre équation pour p2 (m) est correcte? Il est différent (et propose une réponse différente) de toutes les autres équations minimales que j'ai vues. BTW - J'apprécie vraiment votre aide!
OctaviaQ
Cette réponse semble manquer certains coefficients binomiaux .
whuber