Quelle est la différence entre «test d'hypothèse» et «test de signification»?

Y a-t-il une différence entre les expressions «test d'hypothèse» et «test de signification» ou sont-elles les mêmes?

Après une réponse détaillée de @Micheal Lew, j'ai une confusion: de nos jours, l'hypothèse (par exemple, test t pour tester la moyenne) est un exemple de "test de signification" ou de "test d'hypothèse"? Ou est-ce une combinaison des deux? Comment les différencieriez-vous avec un exemple simple?

hypothesis-testing statistical-significance love-stats
la source

Le test t de Student peut être utilisé pour fournir une valeur ap qui peut ensuite être utilisée dans un test de signification de Fisherian (la valeur p est le niveau de signification) ou dans un test d'hypothèse de Neyman-pearsonian (si la valeur p est inférieure à l'alpha prédéfini alors le résultat est «significatif»). La différence réside dans ce qui est fait avec le résultat du test t plutôt que de quelle école de pensée le test t provient (bien que l'approche de Gossett ait beaucoup plus en commun avec Fisher qu'avec NP).

Michael Lew - réintègre Monica le

Réponses:

Le test de signification est ce que Fisher a conçu et le test d'hypothèse est ce que Neyman et Pearson ont conçu pour remplacer le test de signification. Ils ne sont pas identiques et sont mutuellement incompatibles dans une mesure qui surprendrait la plupart des utilisateurs de tests d'hypothèse nulle.

Les tests de signification de Fisher donnent une valeur p qui représente l'extrême gravité des observations sous l'hypothèse nulle. Cette valeur de p est un indice de preuve par rapport à l'hypothèse nulle et au niveau de signification.

Les tests d'hypothèse de Neyman et Pearson établissent à la fois une hypothèse nulle et une hypothèse alternative et fonctionnent comme une règle de décision pour accepter l'hypothèse nulle. En bref (il y a plus que je ne peux mettre ici), vous choisissez un taux acceptable d'inférence faussement positive, alpha (généralement 0,05), et acceptez ou rejetez la valeur nulle selon que la valeur p est supérieure ou inférieure à alpha. Vous devez respecter la décision du test statistique si vous souhaitez vous protéger contre les erreurs fausses positives.

L'approche de Fisher vous permet de prendre en compte tout ce que vous aimez dans l'interprétation du résultat, par exemple des preuves préexistantes peuvent être prises en compte de manière informelle dans l'interprétation et la présentation du résultat. Dans l'approche NP, cela ne peut être fait qu'au stade de la conception expérimentale et semble rarement être fait. À mon avis, l'approche Fisherian est plus utile dans le travail de base en bioscience que l'approche NP.

Il existe une littérature substantielle sur les incohérences entre les tests de signification et les tests d'hypothèse et sur l'hybridation malheureuse des deux. Vous pouvez commencer par cet article: Goodman, Toward evidence-based medical statistics. 1: Le sophisme de la valeur P. http://www.ncbi.nlm.nih.gov/sites/entrez?Db=pubmed&Cmd=ShowDetailView&TermToSearch=10383371

Michael Lew - réintègre Monica
la source

@Micheal Lew - +1 je ne savais pas que Newman / Pearson avait inventé la phrase test d'hypothèse, et je l'ai interprétée de manière plutôt informelle. Pouvez-vous également expliquer en quoi ma réponse est fausse, car je voudrais corriger toute erreur et je suis toujours impatient d'entendre des commentaires.

richiemorrisroe

@richiemorrisroe - Neyman et Pearson ont fait plus que forger une phrase! Ils ont conçu tout un paradigme pour l'analyse statistique - un paradigme qui prédomine dans de nombreux domaines aujourd'hui (malgré mon opinion, et celui de Fisher) qu'il est mal adapté à la plupart des expérimentations scientifiques. Fisher a affirmé à plusieurs reprises que l'approche NP n'était pertinente que pour les tests d'acceptation industrielle. La plupart des textes statistiques d'introduction ne contiennent pas suffisamment de détails et d'histoire pour permettre aux élèves de comprendre qu'il existe des différences importantes entre les écoles de pensée sur les tests statistiques. C'est regrettable.

Michael Lew - réintègre Monica le

Dans de nombreux cas, ces deux déclarations signifient la même chose. Cependant, ils peuvent également être très différents.

Tester une hypothèse consiste d'abord à dire ce que vous pensez qu'il se produira avec un phénomène, puis à développer une sorte de test pour ce phénomène, puis à déterminer si le phénomène s'est réellement produit ou non. Dans de nombreux cas, le test d'une hypothèse ne nécessite aucun type de test statistique. Je me souviens de cette citation du physicien Ernest Rutherford - Si votre expérience a besoin de statistiques, vous auriez dû faire une meilleure expérience. Cela dit, le test d'hypothèses utilise normalement une sorte d'outil statistique.

En revanche, le test de signification est un concept purement statistique. En substance, on a deux hypothèses - l'hypothèse nulle, qui stipule qu'il n'y a pas de différence entre vos deux (ou plus) collections de données. L'hypothèse alternative est qu'il existe une différence entre vos deux échantillons qui ne s'est pas produite par hasard.

Sur la base de la conception de votre étude, vous comparez ensuite les deux échantillons (ou plus) à l'aide d'un test statistique, qui vous donne un nombre, que vous comparez ensuite à une distribution de référence (comme les distributions normales, t ou F) et si cette statistique de test dépasse une valeur critique, vous rejetez l'hypothèse nulle et concluez qu'il y a une différence entre les deux (ou plus) échantillons. Ce critère est normalement que la probabilité que la différence se produise par hasard est inférieure à un sur vingt (p <0,05), bien que d'autres soient parfois utilisés.

richiemorrisroe
la source

Pourriez-vous donner un exemple où les tests d'hypothèses n'impliquent aucun type de tests statistiques?

love-stats

Il s'agit d'une représentation inexacte des tests de signification et des tests d'hypothèse.

Michael Lew - réintègre Monica le

@ user152509 suppose que je mène une étude dans laquelle j'interviewe des utilisateurs et des non utilisateurs d'un produit particulier. Je fais l'hypothèse que les non-utilisateurs se concentreront sur les inconvénients dudit produit, tandis que les utilisateurs parleront de la façon dont le produit les aide. C'est ce que j'observe, d'où une hypothèse testée sans statistiques.

richiemorrisroe

Il est important de faire la distinction entre une hypothèse scientifique et une hypothèse statistique. L'hypothèse nulle testée par des tests statistiques d'hypothèse nulle n'est généralement que la dernière. Tester une hypothèse statistique bien conçue peut permettre une inférence concernant l'hypothèse scientifique, mais ce n'est pas toujours le cas.

Michael Lew - réintègre Monica le

@ Micheal Lew, j'ai une confusion: de nos jours, l'hypothèse (par exemple, le test t pour tester la moyenne) est un exemple de "test de signification" ou de "test d'hypothèse"? Ou est-ce une combinaison des deux? Comment les différencieriez-vous avec un exemple simple?

love-stats