Supposons que et sont chacun tirés iid de certaines distributions, avec indépendant de . Les sont strictement positifs. Vous observez tous les , mais pas les ; vous observez plutôt . Je souhaite estimerà partir de ces informations. Il est clair que l'estimateur est sans biais et peut être calculé en fonction des informations disponibles.
Comment puis-je calculer l'erreur-type de cet estimateur? Pour le sous-cas où ne prend que les valeurs 0 et 1, j'ai naïvement essayé ignorant fondamentalement la variabilité du , mais a constaté que cela fonctionnait mal pour des tailles d'échantillon inférieures à environ 250. (Et cela dépend probablement de la variance du .) Il semble que je n'ai peut-être pas assez d'informations pour calculer une erreur standard «meilleure».
la source
w=rep(1, length(x))
, alorsweighted.var.se(rnorm(50), rep(1, 50))
c'est à peu près0.014
. Je pense que la formule manque unsum(w^2)
dans le numérateur, depuis quandP=1
, la variance est1/(n*(n-1)) * sum((x-xbar)^2)
. Je ne peux pas vérifier l'article cité car il est derrière un mur payant, mais je pense que cette correction. Curieusement, la solution (différente) de Wikipédia devient dégénérée lorsque tous les poids sont égaux: en.wikipedia.org/wiki/… .la source