Il est évidemment fallacieux de supposer que le fait de ne pas rejeter le null implique que le null est vrai. Mais dans un cas où le nul n'est pas rejetée et l'est étroite et centrée sur 0 intervalle de confiance (CI) correspondant, ne fournit pas cette preuve pour l'hypothèse nulle?
Je suis de deux esprits: Oui, dans la pratique, cela fournirait la preuve que l'effet est plus ou moins 0. Cependant, dans un cadre de test d'hypothèse strict, il semble que les effets nuls soient simplement inutilisables pour l'inférence, tout comme leurs IC correspondants. Quelle est donc la signification d'un IC lorsque son estimation ponctuelle n'est pas significative? Est-il également inutilisable pour l'inférence ou peut-il être utilisé comme dans l'exemple précédent pour quantifier la preuve de la nullité?
Les réponses contenant des références savantes sont encouragées.
Réponses:
En bref: oui.
Comme l'a écrit Andy W, conclure que le paramètre est égal à une valeur spécifiée (dans votre cas, la taille de l'effet est égal à zéro), est une question de test d'équivalence.
Dans votre cas, cet intervalle de confiance étroit peut en fait indiquer que l'effet est pratiquement nul, c'est-à-dire que l'hypothèse nulle de l'équivalence peut être rejetée. Une équivalence significative au niveau est généralement montrée par un intervalle de confiance ordinaire 1 - 2 α qui se situe complètement dans un intervalle d'équivalence prédéfini. Cet intervalle d'équivalence tient compte du fait que vous êtes capable de négliger des écarts vraiment infimes, c'est-à-dire que toutes les tailles d'effet dans cet intervalle d'équivalence peuvent être considérées comme pratiquement équivalentes. (Le test statistique d'égalité n'est pas possible.)1 - α 1 - 2 α
Veuillez consulter «Tester les hypothèses statistiques d'équivalence et de non-infériorité» de Stefan Wellek pour une lecture plus approfondie, le livre le plus complet sur cette question.
la source
Des hypothèses nulles illustrent la signification de «Tous les modèles sont faux, mais certains sont utiles». Ils sont probablement plus utiles s'ils ne sont pas pris à la lettre et hors contexte - c'est-à-dire qu'il est important de se rappeler le but épistémique du null. Si elle peut être falsifiée, ce qui est l'objectif visé, alors l'alternative devient plus utile par comparaison, quoique encore peu informative. Si vous rejetez le null, vous dites que l'effet n'est probablement pas nul (ou peu importe - les hypothèses nulles peuvent également spécifier d'autres valeurs pour la falsification) ... alors qu'est-ce que c'est alors?
x=c()
x=append(x,replicate(500,cor(rnorm(999999),rnorm(999999))))
autant de fois que je le voulais avant de terminer cette réponse, ce qui m'a finalement donné 6000 échantillons. Voici un histogramme et un diagramme de densité utilisanthist(x,n=length(x)/100)
etplot(density(x))
, respectivement:skew(x)
kurtosis(x)
Un IC est probablement plus utile pour l'inférence qu'un NHST en général. Il ne représente pas seulement à quel point une idée peut être mauvaise de supposer que le paramètre est négligeable; il représente une bonne idée de ce qu'est réellement le paramètre. On peut toujours décider si cela est négligeable, mais on peut aussi avoir une idée de son caractère non négligeable. Pour plus d'informations sur les intervalles de confiance, voir Cumming (2014 , 2013) .
Références
- Cumming, G. (2013). Comprendre les nouvelles statistiques: ampleur des effets, intervalles de confiance et méta-analyse . Routledge.
- Cumming, G. (2014). Les nouvelles statistiques: pourquoi et comment. Psychological Science, 25 (7), 7–29. Extrait de http://pss.sagepub.com/content/25/1/7.full.pdf+html .
la source
cor.test(rnorm(9999999),rnorm(9999999))