Transformation des statistiques de commande

9

Supposons que les variables aléatoires et sont indépendantes et distribuées. Montrer que a un \ texte {Exp} (1) distribution.X1,...,XnY1,...,YnU(0,a)Zn=nlogmax(Y(n),X(n))min(Y(n),X(n))Exp(1)

J'ai commencé ce problème en définissant {X1,...,Xn,Y1,...Yn}={Z1,...,Zn} Puis le max(Yn,Xn)=Z(2n) serait distribué comme (za)2n et min(Yn,Xn)=Z(1) serait distribué comme 1(1za)2n Les densités peuvent être facilement trouvées comme fZ1(z)=(2n)(1za)2n11a et fZ(2n)(z)=(2n)(za)2n11a

C'est là que j'ai du mal à savoir où aller maintenant maintenant que ceux-ci sont calculés. Je pense que cela doit faire quelque chose avec une transformation, mais je ne suis pas sûr ...

Susan
la source
Vous devez sûrement supposer en plus que non seulement les Xi et Yi iid, mais aussi les Xi sont indépendants des Yj . Cela dit, avez-vous pensé à travailler directement avec le log(Zi) ?
whuber
@whuber ma pensée de votre commentaire serait de mettre en place une transformation où je résout la densité de n * log (Z )? i
Susan
J'ai fait un peu de reformatage (en particulier en transformant et en et ) mais si vous ne l'aimez pas, vous pouvez revenir à la version précédente (en cliquant sur le lien "édité <x> il y a") au-dessus de mon gravatar au bas de votre message), puis en cliquant sur le lien "restaurer" au-dessus de votre version précédente. m i n log minlogminlogmin
Glen_b -Reinstate Monica
3
Susan, vous semblez avoir mal interprété / mal lu la question. La question cherche le rapport de Le dénominateur se réfère à : où est la statistique d'ordre maximum des s, et est la statistique d'ordre maximum des s. En d'autres termes, cherche min (maxX, maxY), PAS le minimum de tous les s et s, donc vous ne pouvez pas utiliser votre astuce Z pour aplatir / combiner toutes les valeurs X et Y. ....... min(Y(n),X(n))Y(n)YX(n)Xmin(Y(n),X(n))XY
max(Y(n),X(n))min(Y(n),X(n))
min(Y(n),X(n))Y(n)YX(n)Xmin(Y(n),X(n))XY
wolfies
2
En tout état de cause, et comme une question distincte, il est inutile (comme vous l'avez fait) de calculer la densité de , et séparément la densité de , car les différentes statistiques d'ordre ne sont pas généralement indépendant. Pour trouver le rapport de , il faudrait d'abord trouver le pdf commun de , si tel était le problème à portée de main (ce qui n'est pas le cas). Z ( 2 n ) Z ( 2 n ) / Z ( 1 ) ( Z ( 1 ) , Z ( 2 n ) )Z(1)Z(2n)Z(2n)/Z(1)(Z(1),Z(2n))
wolfies

Réponses:

2

Ce problème peut être résolu à partir des seules définitions: le seul calcul avancé est l'intégrale d'un monôme.


Observations préliminaires

Travaillons avec les variables et tout long: cela ne change pas mais cela fait iid avec des distributions uniformes , éliminant toutes les apparences distrayantes de dans les calculs. On peut donc supposer sans aucune perte de généralité.Y i / a Z n ( X 1 , , Y n ) ( 0 , 1 ) a a = 1Xi/aYi/aZn(X1,,Yn)(0,1)aa=1

Notez que l'indépendance des et leur distribution uniforme impliquent que pour tout nombre pour lequel , y 0 y 1Yiy0y1

Pr(yY(n))=Pr(yY1,,yYn)=Pr(yY1)Pr(yYn)=yn,

avec un résultat identique pour . Pour référence future, cela nous permet de calculerX(n)

E(2X(n)n)=012xnd(xn)=012nx2n1dx=1.

Solution

Soit un nombre réel positif. Pour trouver la distribution de , substituez sa définition et simplifiez l'inégalité résultante:Z ntZn

Pr(Zn>t)=Pr(Zn/n>t/n)=Pr(exp(Zn/n)>et/n)=Pr(max(X(n),Y(n))min(X(n),Y(n))>et/n)=Pr(et/nmax(X(n),Y(n))>min(X(n),Y(n))).

Cet événement se divise en deux cas équiprobables, selon que ou est le plus petit des deux (et leur intersection, avec une probabilité nulle, peut être ignorée). Il suffit donc de calculer la chance d'un de ces cas (disons où est la plus petite) et de la doubler. Depuis , , nous permettant (en laissant de jouer le rôle de ) pour appliquer les calculs dans la section préliminaire: Y ( n ) Y ( n ) t 0 0 e - t / n X ( n )1 e - t / n X ( n ) yX(n)Y(n)Y(n)t00et/nX(n)1et/nX(n)y

Pr(Zn>t)=2Pr(et/nX(n)>Y(n))=2E[(et/nX(n))n]=etE[2X(n)n]=et.

C'est ce que cela signifie pour d'avoir une distribution Exp . ( 1 )Zn(1)

whuber
la source
4

Je vais esquisser la solution, en utilisant ici un système d'algèbre informatique pour faire les grognons ...

Solution

Si est un échantillon de taille sur le parent , alors le pdf de l'échantillon maximum est: et de même pour . n X Uniforme ( 0 , a ) f n ( x ) = nX1,...,XnnXUniform(0,a)Y

fn(x)=nanxn1
Y

Approche 1: Trouver le pdf commun de(X(n),Y(n))

Puisque et sont indépendants, le pdf conjoint des 2 maximums d'échantillon est simplement le produit des 2 pdf, disons :Y ( X ( n ) , Y ( n ) ) f ( n ) ( x , y )XY(X(n),Y(n))f(n)(x,y)

entrez la description de l'image ici

Étant donné . Alors, le cdf de est est: ZnP(Zn<z)Zn=nlogmax(Y(n),X(n))min(Y(n),X(n))ZnP(Zn<z)

entrez la description de l'image ici

où j'utilise la Probfonction du package mathStatica pour Mathematica pour automatiser. La différenciation du cdf par rapport à donne le pdf de comme exponentiel standard.Z nzZn


Approche 2: Statistiques de commande

Nous pouvons utiliser les statistiques de commande pour contourner les mécanismes de gestion des fonctions Max et Min.

Encore une fois: si est un échantillon de taille sur le parent , alors le pdf de l'échantillon maximum est, disons, : n X Uniforme ( 0 , a ) W = X ( n ) f n ( w )X1,...,XnnXUniform(0,a)W=X(n)fn(w)

entrez la description de l'image ici

Les maximums d'échantillon et sont que deux dessins indépendants de cette distribution de ; c'est-à-dire que les statistiques d'ordre et de (dans un échantillon de taille 2) sont exactement ce que nous recherchons:X(n)Y(n)W1st2ndW

  • W(1)=min(Y(n),X(n))

  • W(2)=max(Y(n),X(n))

Le pdf commun de , dans un échantillon de taille 2, disons , Est:(W(1),W(2))g(.,.)

entrez la description de l'image ici

Étant donné . Alors, le cdf de est est: ZnP(Zn<z)Zn=nlogmax(Y(n),X(n))min(Y(n),X(n))ZnP(Zn<z)

entrez la description de l'image ici

L'avantage de cette approche est que le calcul de probabilité n'implique plus les fonctions max / min, ce qui peut rendre la dérivation (surtout à la main) un peu plus facile à exprimer.

Autre

Selon mon commentaire ci-dessus, il semble que vous ayez mal interprété la question ...

On nous demande de trouver:

Zn=nlogmax(Y(n),X(n))min(Y(n),X(n))

où le dénominateur est min (xMax, yMax), ... pas le minimum de tous les 's et s'.YXY

Wolfies
la source
Après votre croquis, je comprends comment j'ai mal interprété la question. Je comprends comment calculer le pdf commun des deux échantillons maximums, mais je ne sais toujours pas comment interpréter le rapport max / min.
Susan
J'ai ajouté une dérivation alternative à l'aide des statistiques de commande, qui «contourne» le max / min.
wolfies
Si vous aviez commencé avec les journaux des données, Susan, vous examineriez les différences de statistiques de commande plutôt que les ratios .
whuber
Je ne suis pas convaincu que l'utilisation de calculs formels par ordinateur soit la meilleure façon d'expliquer la raison pour laquelle le ratio est une variable aléatoire Exp (1).
Xi'an
1
Bon point ... sauf que l'OP ne demande pas la raison ... mais montrer que c'est Exp [1]. Je ne sais pas non plus s'il s'agit ou non de devoirs (ou d'une mission) ... et c'est en fait un bel avantage d'utiliser un ordinateur: on fournit les étapes à suivre, vérifie le résultat, pour que l'on ait la bonne approche , mais la mécanique est toujours laissée à l'OP. Ce serait bien que quelqu'un explore la suggestion de @ whuber de prendre des journaux au début.
wolfies