Variance du maximum des variables aléatoires gaussiennes

11

Étant donné les variables aléatoires échantillonné iid à partir de , définissez X1,X2,,XnN(0,σ2)

Z=maxi{1,2,,n}Xi

Nous avons cela E[Z]σ2logn . Je me demandais s'il y avait des limites supérieures / inférieures sur Var(Z) ?

Diable
la source
1
Pour commencer, je pense que vous constaterez que Var(Z)σ2 (l'égalité est atteinte à n = 1), et Var (Z) diminue à mesure que n augmente. Je vous laisse le soin de fournir cette limite plus stricte en fonction de n.
Mark L. Stone
1
L'échantillon max moins l'échantillon min est connu sous le nom de plage étudiée et suit la distribution de la plage étudiée si les variables aléatoires sous-jacentes sont IID normales. C'est au moins vaguement lié à ce que vous demandez ... (pourrait donner un point de départ pour la lecture). De retour à votre question spécifique, je suis sûr que vous pourriez écrire une simulation Monte-Carlo assez facilement pour trouver une réponse pratique.
Matthew Gunn
2
Les deux réponses à stats.stackexchange.com/questions/105745 fournissent des approximations de l'écart type (et donc de la variance), en utilisant des analyses qui peuvent produire des limites supérieures ou inférieures.
whuber
Connexes: stats.stackexchange.com/questions/77110/…
kjetil b halvorsen

Réponses:

9

Vous pouvez obtenir la borne supérieure en appliquant l'inégalité de Talagrand: regardez le livre de Chatterjee (phénomène de superconcentration par exemple).

Il vous indique que .Var(f)Ci=1nif221+log(if||2/if1)

Pour le maximum, vous obtenez , puis en intégrant par rapport à la mesure gaussienne sur vous obtenez par symétrie. (Ici, je choisis tous mes RV iid avec une variance).if=1Xi=maxRnif22=if1=1n

C'est le véritable ordre de la variance: puisque vous avez une limite supérieure sur l'attente du maximum, cet article d'Eldan-Ding Zhai (Sur les pics multiples et la déviation modérée du supremum gaussien) vous dit que
Var(maxXi)C/(1+E[maxXi])2

Il est également possible d'obtenir de fortes inégalités de concentration reflétant celles-ci liées à la variance: vous pouvez consulter http://www.wisdom.weizmann.ac.il/mathusers/gideon/papers/ranDv.pdf ou, pour un processus gaussien plus général , sur mon papier https://perso.math.univ-toulouse.fr/ktanguy/files/2012/04/Article-3-brouillon.pdf

En général, il est assez difficile de trouver le bon ordre de grandeur de la variance d'un supremum gaussien, car les outils de la théorie de la concentration sont toujours sous-optimaux pour la fonction maximale.

Pourquoi avez-vous besoin de ce genre d'estimations, si je peux me le permettre?

Tanguy Kevin
la source
1
Notons que l'inégalité de Talagrand, est une amélioration de l'inégalité de Poincaré satisfaite par la mesure gaussienne standard. Il y a plus à ce sujet dans l'article de Cordero-Ledoux "Mesures hypercontractives, inégalités et influences de Talagrand".
Tanguy Kevin
2
Merci beaucoup. Cela aide beaucoup. J'étais confronté au problème où j'essayais de limiter la probabilité d'erreurs dans l'estimation de la longueur des exécutions de 0 dans un flux binaire à partir d'observations via un canal de suppression. Après une approximation gaussienne, le max semblait être un estimateur naturel, et j'ai trouvé que la limite de ses performances n'était pas triviale. Dans mon problème particulier, j'ai pu trouver un moyen de le contourner en le réduisant à un problème d'estimation MMSE gaussien.
Devil
@TanguyKevin, qu'est-ce que C dans la limite inférieure?
xsari3x
1

Plus généralement, l'attente et la variance de la plage dépendent de la graisse de la queue de votre distribution. Pour la variance, c'est où dépend de votre distribution ( pour uniforme, pour gaussien et pour exponentiel.) Voir ici . Le tableau ci-dessous montre l'ordre de grandeur de la plage.O(nB)BB=2B=1B=0

entrez la description de l'image ici

Vincent Granville
la source