Pourquoi les statisticiens nous découragent-ils de qualifier les résultats de " très significatifs" lorsque la valeur est bien inférieure au niveau conventionnel de ?
Est-il vraiment faux de faire confiance à un résultat qui a 99,9% de chances de ne pas être une erreur de type I ( ) de plus qu'un résultat qui ne vous donne que cette chance à 99% ( )?
Réponses:
Je pense qu'il n'y a pas grand-chose de mal à dire que les résultats sont "très significatifs" (même si oui, c'est un peu bâclé).
Cela signifie que si vous aviez défini un niveau de signification beaucoup plus petit , vous auriez quand même jugé les résultats significatifs. Ou, de manière équivalente, si certains de vos lecteurs ont un α beaucoup plus petit en tête, ils peuvent toujours juger vos résultats significatifs.α α
Notez que le niveau de signification est dans l'œil du spectateur, tandis que la valeur p est (avec quelques mises en garde) une propriété des données.α p
Observer n'est tout simplement pas la même chose qu'observer p = 0,04 , même si les deux peuvent être qualifiés de «significatifs» par les conventions standard de votre domaine ( α = 0,05 ). Une valeur p minuscule signifie une preuve plus forte contre le zéro (pour ceux qui aiment le cadre de Fisher pour les tests d'hypothèse); cela signifie que l'intervalle de confiance autour de la taille de l'effet exclura la valeur nulle avec une marge plus grande (pour ceux qui préfèrent les IC aux valeurs de p ); cela signifie que la probabilité postérieure du nul sera plus petite (pour les Bayésiens avec certains antérieurs); tout cela est équivalent et signifie simplement que les résultats sont plus convaincantsp = 10- 10 p = 0,04 α = 0,05 p p . Voir Les valeurs de p plus petites sont-elles plus convaincantes? pour plus de discussion.
Le terme "hautement significatif" n'est pas précis et n'a pas besoin de l'être. Il s'agit d'un jugement d'expert subjectif, similaire à l'observation d'une taille d'effet étonnamment grande et à l'appeler "énorme" (ou peut-être simplement "très grand"). Il n'y a rien de mal à utiliser des descriptions qualitatives et subjectives de vos données, même dans la rédaction scientifique; à condition bien sûr que l'analyse quantitative objective soit également présentée.
Voir également quelques excellents commentaires ci-dessus, +1 à @whuber, @Glen_b et @COOLSerdash.
la source
C'est une question courante.
Une question similaire peut être "Pourquoi p <= 0,05 est-il considéré comme significatif?" ( http://www.jerrydallal.com/LHSP/p05.htm )
@ Michael-Mayer a donné une partie de la réponse: la signification n'est qu'une partie de la réponse. Avec suffisamment de données, certains paramètres apparaissent généralement comme «significatifs» (recherchez la correction de Bonferroni). Les tests multiples sont un problème spécifique en génétique où de grandes études à la recherche de signification sont courantes et des valeurs de p <10 -8 sont souvent requises ( http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2621212/ ).
En outre, un problème avec de nombreuses analyses est qu'elles étaient opportunistes et non pré-planifiées (c'est-à-dire "Si vous torturez suffisamment les données, la nature avouera toujours." - Ronald Coase).
Généralement, si une analyse est pré-planifiée (avec une correction d'analyse répétée pour la puissance statistique), elle peut être considérée comme significative. Souvent, des tests répétés par plusieurs individus ou groupes sont le meilleur moyen de confirmer que quelque chose fonctionne (ou non). Et la répétition des résultats est le plus souvent le bon test de signification.
la source
Un test est un outil pour une décision en noir et blanc, c'est-à-dire qu'il essaie de répondre à une question oui / non comme «y a-t-il un véritable effet de traitement?». Souvent, en particulier si l'ensemble de données est volumineux, une telle question est tout à fait un gaspillage de ressources. Pourquoi poser une question binaire s'il est possible d'obtenir une réponse à une question quantitative du type «quel est le véritable effet du traitement»? qui répond implicitement aussi à la question oui / non? Ainsi, au lieu de répondre à une question oui / non non informative avec une grande certitude, nous recommandons souvent l'utilisation d'intervalles de confiance qui contiennent beaucoup plus d'informations.
la source