Soit la statistique d'ordre d'un échantillon iid de taille de . Supposons que les données soient censurées afin que nous ne voyions que le haut des données, c'est-à-direMettez , quelle est la distribution asymptotique de
Ceci est quelque peu lié à cette question et à cela et aussi marginalement à cette question.
Toute aide serait appréciée. J'ai essayé différentes approches mais n'ai pas pu progresser beaucoup.
Réponses:
Comme n'est qu'un facteur d'échelle, sans perte de généralité, choisissez les unités de mesure qui font , ce qui rend la fonction de distribution sous-jacente avec la densité .λ λ=1 F(x)=1−exp(−x) f(x)=exp(−x)
D'après des considérations parallèles à celles du théorème de la limite centrale pour les médianes de l'échantillon , est asymptotiquement normal avec la moyenne et la varianceX(m) F−1(p)=−log(1−p)
En raison de la propriété sans mémoire de la distribution exponentielle , les variables agissent comme les statistiques d'ordre d'un échantillon aléatoire de tirées de , auquel a été ajouté. L'écriture(X(m+1),…,X(n)) n−m F X(m)
pour leur moyenne, il est immédiat que la moyenne de est la moyenne de (égale à ) et que la variance de est multipliée par la variance de (également égale à ). Le théorème central limite implique que le normalisé est asymptotiquement Standard Normal. De plus, parce que est conditionnellement indépendante de , nous avons en même temps la version normalisée de devient asymptotiquement standard normal et décorrélé . C'est,Y F 1 Y 1/(n−m) F 1 Y Y X(m) X(m) Y
a asymptotiquement une distribution bivariée Standard Normal.
Les graphiques rapportent des données simulées pour des échantillons de ( itérations) et . Une trace d'asymétrie positive demeure, mais l'approche de la normalité bivariée est évidente dans le manque de relation entre et et la proximité des histogrammes à la densité normale normale (illustrée dans points rouges).n=1000 500 p=0.95 Y−X(m) X(m)
La matrice de covariance des valeurs standardisées (comme dans la formule ) pour cette simulation était confortablement proche de la matrice unitaire dont elle se rapproche.(1)
Len p
R
code qui a produit ces graphiques est facilement modifié pour étudier d'autres valeurs de , et de taille de simulation.la source