Quelle est une bonne règle de base pour savoir comment choisir la question pour l'hypothèse nulle. Par exemple, si je veux vérifier si l'hypothèse B est vraie, dois-je utiliser B comme nulle, B comme hypothèse alternative ou PAS B comme nulle? J'espère que la question est claire. Je sais que cela a quelque chose à voir avec l'erreur que je veux minimiser (Type I?), Mais j'oublie toujours comment ça se passe, car je n'ai pas d'intuition claire pour cela. Merci.
hypothesis-testing
Nestor
la source
la source
Réponses:
Une règle de base d'un bon conseiller à moi était de définir l'hypothèse nulle sur le résultat que vous ne voulez pas être vrai, c'est-à-dire le résultat dont vous voulez montrer le contraire direct.
Exemple de base: supposons que vous ayez développé un nouveau traitement médical et que vous vouliez montrer qu'il est en effet meilleur que le placebo. Vous définissez donc l'hypothèse nulle nouveau traitement est égal ou pire que le placebo et l'hypothèse alternative H 1 : = le nouveau traitement est meilleur que le placebo.H0:= H1:=
En effet, au cours d'un test statistique, vous rejetez l'hypothèse nulle (et privilégiez l'hypothèse alternative) ou vous ne pouvez pas la rejeter. Puisque votre "objectif" est de rejeter l'hypothèse nulle, vous la définissez sur le résultat que vous ne voulez pas être vrai.
Note latérale: Je suis conscient qu'il ne faut pas mettre en place un test statistique pour le tordre et le casser jusqu'à ce que l'hypothèse nulle soit rejetée, le langage informel n'a été utilisé que pour rendre cette règle plus facile à retenir.
Cela peut également être utile: quelle est la signification des valeurs p et des valeurs t dans les tests statistiques? et / ou Qu'est-ce qu'une bonne introduction aux tests d'hypothèses statistiques pour les informaticiens?
la source
Si l'hypothèse B est l'hypothèse intéressante, vous pouvez prendre non-B comme hypothèse nulle et contrôler, sous la valeur nulle, la probabilité de l'erreur de type I pour rejeter à tort non-B au niveau . Rejeter le non-B est alors interprété comme une preuve en faveur de B parce que nous contrôlons l'erreur de type I, il est donc peu probable que le non-B soit vrai. Confus ... ?α
Prenons l'exemple du traitement contre l'absence de traitement dans deux groupes d'une population. L'hypothèse intéressante est que le traitement a un effet, c'est-à-dire qu'il y a une différence entre le groupe traité et le groupe non traité en raison du traitement. L'hypothèse nulle est qu'il n'y a pas de différence et nous contrôlons la probabilité de rejeter à tort cette hypothèse. Ainsi, nous contrôlons la probabilité de conclure à tort qu'il existe un effet de traitement lorsqu'il n'y a pas d'effet de traitement. L'erreur de type II est la probabilité d'accepter à tort la valeur nulle lorsqu'il y a un effet de traitement.
La formulation ci-dessus est basée sur le cadre de Neyman-Pearson pour les tests statistiques, où les tests statistiques sont considérés comme un problème de décision entre les cas, le nul et l'alternative. Le niveau est la fraction de fois où nous commettons une erreur de type I si nous répétons (indépendamment) le test. Dans ce cadre, il n'y a vraiment aucune distinction formelle entre le nul et l'alternative. Si nous échangeons le nul et l'alternative, nous échangeons la probabilité d'erreurs de type I et de type II. Cependant, nous n'avons pas contrôlé la probabilité d'erreur de type II ci-dessus (cela dépend de la taille de l'effet du traitement), et en raison de cette asymétrie, nous pouvons préférer dire que nous ne rejetons pasα l'hypothèse nulle (au lieu de cela, nous acceptons l'hypothèse nulle). Ainsi, nous devons être prudents avant de conclure que l'hypothèse nulle est vraie juste parce que nous ne pouvons pas la rejeter.
Aucun des deux cadres n'est sans problème et la terminologie est souvent mélangée. Je peux recommander le livre Preuve statistique: un paradigme de vraisemblance de Richard M. Royall pour un traitement clair des différents concepts.
la source
La réponse "fréquentiste" consiste à inventer une hypothèse nulle de la forme "pas B" et ensuite à argumenter contre "pas B", comme dans la réponse de Steffen. C'est l'équivalent logique de l'argument "Vous avez tort, donc je dois avoir raison". C'est le genre de raisonnement utilisé par le politicien (c'est-à-dire que l'autre parti est mauvais, donc nous sommes bons). Il est assez difficile de traiter plus d'une alternative avec ce type de raisonnement. C'est parce que l'argument "vous avez tort, donc j'ai raison" n'a de sens que lorsqu'il n'est pas possible que les deux se trompent, ce qui peut certainement se produire lorsqu'il existe plusieurs hypothèses alternatives.
La réponse «bayésienne» consiste simplement à calculer la probabilité de l'hypothèse que vous êtes intéressé à tester, sous réserve des preuves dont vous disposez. Cela contient toujours des informations préalables, qui sont simplement les hypothèses que vous avez faites pour bien poser votre problème (toutes les procédures statistiques reposent sur des informations préalables, celles bayésiennes les rendent simplement plus explicites). Il se compose également généralement de certaines données, et nous avons par théorème de bayes
En bref, si vous utilisez le rapport de vraisemblance pour tester votre hypothèse, peu importe ce que vous appelez l'hypothèse nulle. Passer le null à l'alternative ne fait que changer la décision enΛ−1<Λ~−1
la source
L'hypothèse nulle devrait généralement supposer que les différences dans une variable de réponse sont dues uniquement à l'erreur.
Par exemple, si vous souhaitez tester l'effet d'un facteurH0
A
x
A
x
Ne pas rejeter cette hypothèse nulle serait interprété comme:
1) toutes les différences
x
sont dues à l'erreur seule et nonA
ou,2) que les données sont insuffisantes pour détecter une différence même s'il en existe une (voir erreur de type 2 ci-dessous).
Le rejet de cette hypothèse nulle serait interprété comme l'hypothèse alternative:Ha
A
x
A
x
A
surx
même s'il en existe un.la source