Quelle est la variance du maximum d'un échantillon?

$B$

Var (max_{i} X_{i}) \leq B,

$\mbox{Var}(\max_i X_i) \leq B \enspace,$

X = {X_{1}, \dots, X_{M}}

$X = \{ X_1, \ldots, X_M \}$

M

$M$

μ_{1}, \dots, μ_{M}

$\mu_1, \ldots, \mu_M$

σ_{1}^{2}, \dots, σ_{M}^{2}

$\sigma_1^2, \ldots, \sigma_M^2$

Je peux en déduire que

Var (max_{i} X_{i}) \leq \sum_{i} σ_{i}^{2},

$\mbox{Var}(\max_i X_i) \leq \sum_i \sigma_i^2 \enspace,$ mais cette limite semble très lâche. Un test numérique semble indiquer que

B = max_{i} σ_{i}^{2}

$B = \max_i \sigma_i^2$ pourrait être une possibilité, mais je n'ai pas pu le prouver. Toute aide est appréciée.

variance bounds maximum Peter
la source

(Voulez-vous supposer que les sont indépendants?) La conjecture est plausible mais semble fausse. Par exemple, faites quelques essais où les sont iid avec CDF , , . La variance de leur maximum, par rapport à leur variance commune, augmente sans limite à mesure que croît.

X_{i}

$X_i$

X_{i}

$X_i$

1 - x^{1 - s}

$1-x^{1-s}$

1 \leq x \leq \infty

$1\le x\le \infty$

s > 3

$s\gt 3$

M

$M$

whuber

@whuber Merci, cela explique pourquoi je n'ai pas pu prouver cette conjecture :) Je suis en effet intéressé par le cas où les sont indépendants. Juste pour clarifier, je m'intéresse principalement aux limites générales qui n'utilisent que les deux premiers moments. Je ne sais pas s'il existe même des limites générales plus nettes que la variance commune.

X_{i}

$X_i$

Peter

Je dois souligner que votre somme liée (en supposant qu'elle est correcte - ce serait bien de voir un croquis de la preuve) est serrée. Par exemple, laissez être pris en charge sur l'intervalle avec des écarts ne dépassant pas et laissez être pris en charge sur . Alors as, avec variance , mais l'inégalité peut être resserrée autant que vous le souhaitez en rétrécissant .

X_{2}, \dots, X_{M}

$X_2,\ldots,X_M$

[- \infty, a]

$[-\infty, a]$

ε^{2}

$\varepsilon^2$

X_{1}

$X_1$

[a, \infty]

$[a,\infty]$

max_{i} X_{i} = X_{1}

$\max_i{X_i}=X_1$

σ_{1}^{2} \leq σ_{1}^{2} + (M - 1) ε^{2}

$\sigma_1^2\le\sigma_1^2+(M-1)\varepsilon^2$

ε^{2}

$\varepsilon^2$

whuber

Pour les données iid, la théorie des valeurs extrêmes fournit les classes de distributions vers lesquelles le maximum d'échantillon converge, avec certaines conditions sur les queues des distributions originales donnant différentes classes des distributions asymptotiques. Je doute donc que vous serez en mesure de tirer une bonne limite basée uniquement sur les deux moments, bien que je ne connaisse que tangentiellement la théorie.

StasK

Réponses:

Pour toute variable aléatoire , la meilleure limite générale est comme indiqué dans la question d'origine. Voici un schéma de preuve: si X, Y sont IID alors . Étant donné un vecteur de variables éventuellement dépendantes , soit un vecteur indépendant avec la même distribution conjointe. Pour tout , nous avons par la limite d'union que , et l'intégration de ce de à produit l'inégalité revendiquée. $n$ $X_i$ $\newcommand{\Var}{\mathrm{Var}}\Var(\max X_i) \le \sum_i \Var(X_i)$ $E[(X-Y)^2] =2\Var(X)$ $(X_1,\ldots ,X_n)$ $(Y_1,\ldots ,Y_n)$ $r>0$ $P[ |\max_i X_i-\max_i Y_i|^2 >r] \le \sum_i P[ | X_i-Y_i|^2 >r]$ $dr$ $0$ $\infty$

Si sont des indicateurs IID d'événements de probabilité , alors est un indicateur d'un événement de probabilité . En fixant et en laissant tendre à zéro, on obtient et . $X_i$ $\epsilon$ $\max X_i$ $n\epsilon+O(n^2 \epsilon^2)$ $n$ $\epsilon$ $\Var(X_i)=\epsilon-\epsilon^2$ $\Var(\max_i X_i)= n\epsilon +O(n^2\epsilon^2)$

Yuval Peres
la source

Une question sur MathOverflow est liée à cette question.

Pour les variables aléatoires IID, la ème la plus élevée est appelée statistique d'ordre . $k$

Même pour les variables aléatoires IID Bernoulli, la variance de toute statistique d'ordre autre que la médiane peut être supérieure à la variance de la population. Par exemple, si est avec une probabilité et avec une probabilité et , alors le maximum est avec une probabilité , donc la variance de la population est de tandis que la variance du maximum est d'environ . $X_i$ $1$ $1/10$ $0$ $9/10$ $M=10$ $1$ $\approx 1- 1/e$ $0.09$ $0.23$

Voici deux articles sur les variances des statistiques de commande:

Yang, H. (1982) "Sur les variances de la médiane et d'autres statistiques d'ordre". Taureau. Inst. Math. Acad. Sinica, 10 (2) pp. 197-204

Papadatos, N. (1995) "Variance maximale des statistiques de commande". Ann. Inst. Statist. Math., 47 (1) p. 185-193

Je crois que la limite supérieure de la variance du maximum dans le deuxième article est . Ils soulignent que l'égalité ne peut pas se produire, mais toute valeur inférieure peut se produire pour les variables aléatoires IID Bernoulli. $M\sigma^2$

Douglas Zare
la source