Je lisais cette question concernant la régression à grande échelle ( lien ) où whuber a souligné un point intéressant comme suit:
"Presque tous les tests statistiques que vous exécutez seront si puissants qu'il est presque sûr d'identifier un effet" significatif ". Vous devez vous concentrer beaucoup plus sur l'importance statistique, comme la taille de l'effet, plutôt que sur la signification."
--- whuber
Je me demandais si c'est quelque chose qui peut être prouvé ou tout simplement des phénomènes courants dans la pratique?
Tout pointeur vers une preuve / discussion / simulation serait vraiment utile.
regression
statistical-significance
Bayesric
la source
la source
Réponses:
C'est assez général.
Imaginez qu'il y ait un petit effet, mais non nul (c'est-à-dire une certaine déviation par rapport au zéro que le test est capable de détecter).
À de petits échantillons, les chances de rejet seront très proches du taux d'erreur de type I (le bruit domine le petit effet).
À mesure que la taille des échantillons augmente, l'effet estimé devrait converger vers cet effet sur la population, tandis que dans le même temps, l'incertitude de l'effet estimé diminue (normalement ), jusqu'à ce que la probabilité que la situation nulle soit suffisamment proche de l'effet estimé qu'elle est toujours plausible dans un échantillon de la population sélectionné au hasard se réduit à zéro.n−−√
Ce qui veut dire qu'avec des points nuls, le rejet finit par devenir certain, car dans presque toutes les situations réelles, il y aura essentiellement toujours une certaine déviation par rapport au nul.
la source
Ce n'est pas une preuve, mais il n'est pas difficile de montrer l'influence de la taille de l'échantillon dans la pratique. Je voudrais utiliser un exemple simple de Wilcox (2009) avec des changements mineurs:
Nous pouvons utiliser le test t pour cette analyse:
En supposant que la moyenne de l'échantillon ( ) est de 45 et l'écart-type de l'échantillon ( sX¯ s ) est 11,
Si vous regardez un tableau contenant des valeurs critiques de la distribution de Student avec ν degrés de libertét ν , vous verrez que pour , P ( T ≤ - 1,83 ) = 0,05 . Donc avec T = - 1,44 , nous ne parvenons pas à rejeter l'hypothèse nulle. Supposons maintenant que nous avons la même moyenne d'échantillon et l'écart-type, mais 100 observations à la place:v=10−1 P(T≤−1.83)=.05 T=−1.44
Wilcox, RR, 2009. Statistiques de base: comprendre les méthodes conventionnelles et les idées modernes . Oxford University Press, Oxford.
la source
En régression, pour le modèle global, le test est sur F. Ici
la source