Je cherche la valeur asymptotique ( ) de (le log du déterminant de) la covariance du % d'observations avec la plus petite distance euclédienne à l'origine dans un échantillon de taille tiré de, disons , un gaussien standard bivarié.
- L'hyper-volume d'une ellipse est proportionnel au déterminant de sa matrice de covariance, d'où le titre .--
--Par Gaussien bivarié standard, je veux dire où est un vecteur de 0 de longueur 2 et est la matrice d'identité de rang 2 .---
Il est facile de voir par des simulations que lorsque le nombre est d'environ :
library(MASS)
n<-10000
p<-2
x<-mvrnorm(n,rep(0,p),diag(2))
h<-ceiling(0.714286*n)
p<-ncol(x)
w<-mahalanobis(x,rep(0,p),diag(p),inverted=TRUE) #These are eucledian distances, because the covariance used is the identity matrix
s<-(1:n)[order(w)][1:h]
log(det(cov(x[s,])))
mais je ne me souviens pas comment obtenir une expression exacte (ou à défaut, une meilleure approximation) pour cela.
r
mathematical-statistics
simulation
user603
la source
la source
Réponses:
Ok, cette question semble se poser de temps en temps, donc je pense que je vais donner une réponse générale.
Dans [1], les auteurs montrent que si with symmetric positive definite, andxxi∼Np(μμ,ΣΣ),i=1,…,n Σ Sα
pour etqα=χ2p(α),0<α⩽1
Ensuite, asymptotiquement, converge vers oùCα lαΣ
Cette approximation est vraiment bonne (ici pour alpha = 60/70):
Donc, enfin, pour répondre à la question, le déterminant de la matrice de covariance des observations avec la plus petite norme euclédienne à l'origine (c'est le cas particulier où et ) est donné par:log [αn] Σ=IIp μμ=00p
la source