Je lisais sur le calcul de l'estimation non biaisée de l'écart-type et la source que j'ai lue a déclaré
(...) sauf dans certaines situations importantes, la tâche a peu de pertinence pour les applications de la statistique car son besoin est évité par des procédures standard, telles que l'utilisation de tests de signification et d'intervalles de confiance, ou en utilisant l'analyse bayésienne.
Je me demandais si quelqu'un pouvait expliquer le raisonnement derrière cette déclaration, par exemple, l'intervalle de confiance n'utilise-t-il pas l'écart-type dans le calcul? Par conséquent, les intervalles de confiance ne seraient-ils pas affectés par un écart-type biaisé?
ÉDITER:
Merci pour les réponses jusqu'à présent, mais je ne suis pas sûr de suivre certains des raisonnements à leur sujet, je vais donc ajouter un exemple très simple. Le fait est que si la source est correcte, alors quelque chose ne va pas de ma conclusion à l'exemple et j'aimerais que quelqu'un montre comment la valeur p ne dépend pas de l'écart-type.
Supposons qu'un chercheur souhaite tester si le score moyen des élèves de cinquième année à un test dans sa ville diffère de la moyenne nationale de 76 avec un niveau de signification de 0,05. Le chercheur a échantillonné au hasard les scores de 20 étudiants. La moyenne de l'échantillon était de 80,85 avec un écart-type de l'échantillon de 8,87. Cela signifie: t = (80,85-76) / (8,87 / sqrt (20)) = 2,44. Une table t est ensuite utilisée pour calculer que la valeur de probabilité bilatérale de à de 2,44 avec 19 df est de 0,025. Ceci est inférieur à notre niveau de signification de 0,05, nous rejetons donc l'hypothèse nulle.
Donc, dans cet exemple, la valeur de p (et peut-être votre conclusion) ne changerait-elle pas selon la façon dont vous avez estimé l'écart-type de votre échantillon?
la source
Réponses:
Je suis d'accord avec Glen_b à ce sujet. Je peux peut-être ajouter quelques mots pour rendre le point encore plus clair. Si les données proviennent d'une distribution normale (situation iid) avec une variance inconnue, la statistique t est la quantité pivot utilisée pour générer des intervalles de confiance et effectuer des tests d'hypothèse. La seule chose qui compte pour cette inférence est sa distribution sous l'hypothèse nulle (pour déterminer la valeur critique) et sous l'alternative (pour déterminer la puissance et l'échantillon). Ce sont les distributions t centrale et non centrale, respectivement. Considérant maintenant un instant le problème d'un échantillon, le test t a même des propriétés optimales comme test pour la moyenne d'une distribution normale. Maintenant, la variance de l'échantillon est un estimateur non biaisé de la variance de la population, mais sa racine carrée est un estimateur biaisé de l'écart-type de la population. C'est pas ca' t importe que cet estimateur BIASED entre dans le dénominateur de la quantité pivot. Maintenant, il joue un rôle dans la mesure où il s'agit d'un estimateur cohérent. C'est ce qui permet à la distribution t d'approcher la normale standard lorsque la taille de l'échantillon va à l'infini. Mais étant biaisé pour tout fixe n'affecte pas les belles propriétés du test.n
À mon avis, l'impartialité est surestimée dans les cours d'introduction à la statistique. La précision et la cohérence des estimateurs sont les propriétés réelles qui méritent d'être soulignées.
Pour d'autres problèmes où des méthodes paramétriques ou non paramétriques sont appliquées, une estimation de l'écart type n'entre même pas dans la formule.
la source
Considérons un intervalle calculé sur la base d'une quantité pivot, comme une statistique t. La valeur moyenne de l'estimateur pour l'écart type n'entre pas vraiment en ligne de compte - l'intervalle est basé sur la distribution de la statistique. Donc, la déclaration est exacte dans la mesure où cela va.
la source
L'interprétation est toujours une partie de la spéculation, mais je pense que la signification implicite est que souvent vous pouvez obtenir le résultat souhaité sans estimer explicitement l'écart type. En d'autres termes, je pense que l'auteur fait référence à des situations où vous n'utiliseriez pas d' estimation de l'écart-type, plutôt qu'une estimation biaisée.
Par exemple, si vous pouvez construire une estimation de la distribution entière d'une statistique, vous pouvez calculer des intervalles de confiance sans utiliser l'écart-type. En fait, pour de nombreuses distributions (non normales), l'écart-type lui-même (et la moyenne) n'est pas suffisant pour calculer une estimation de l'intervalle de confiance. Dans d'autres cas, comme un test de signe , vous n'avez pas besoin non plus d'estimation de l'écart-type.
(Bien sûr, il n'est pas trivial de construire une estimation non biaisée d'une distribution complète, et dans les statistiques bayésiennes, il est en fait assez courant d'introduire explicitement un biais dans l'a priori.)
la source