Lorsque nous faisons des tests, nous nous retrouvons avec deux résultats.
1) Nous rejetons l'hypothèse nulle
2) Nous ne rejetons pas l'hypothèse nulle.
Nous ne parlons pas d'accepter des hypothèses alternatives. Si nous ne parlons pas d'accepter une hypothèse alternative, pourquoi devons-nous avoir une hypothèse alternative?
Voici la mise à jour: Quelqu'un pourrait-il me donner deux exemples:
1) rejeter l'hypothèse nulle équivaut à accepter l'hypothèse alternative
2) rejeter l'hypothèse nulle n'est pas égal à accepter l'hypothèse alternative
hypothesis-testing
user1700890
la source
la source
Réponses:
Je vais me concentrer sur "Si nous ne parlons pas d'accepter une hypothèse alternative, pourquoi devons-nous avoir une hypothèse alternative?"
Parce que cela nous aide à choisir une statistique de test significative et à concevoir notre étude pour avoir une puissance élevée --- une grande chance de rejeter le zéro lorsque l'alternative est vraie. Sans alternative, nous n'avons pas de concept de pouvoir.
Imaginez que nous n'avons qu'une hypothèse nulle et aucune alternative. Ensuite, il n'y a aucune indication sur la façon de choisir une statistique de test qui aura une puissance élevée. Tout ce que nous pouvons dire, c'est: «Rejetez la valeur nulle chaque fois que vous observez une statistique de test dont la valeur est peu probable sous la valeur nulle». Nous pouvons choisir quelque chose d'arbitraire: nous pourrions dessiner des nombres aléatoires uniformes (0,1) et rejeter le nul lorsqu'ils sont inférieurs à 0,05. Cela se produit sous le null "rarement", pas plus de 5% du temps --- mais c'est aussi tout aussi rare lorsque le null est faux. Il s'agit donc techniquement d'un test statistique, mais il n'a aucun sens comme preuve pour ou contre quoi que ce soit.
Au lieu de cela, nous avons généralement une hypothèse alternative scientifiquement plausible ("Il y a une différence positive dans les résultats entre les groupes de traitement et de contrôle dans mon expérience"). Nous aimerions le défendre contre des critiques potentiels qui pourraient faire l'hypothèse nulle en tant que défenseurs du diable ("Je ne suis pas encore convaincu --- peut-être que votre traitement fait mal, ou n'a aucun effet du tout , et toute différence apparente dans la les données ne sont dues qu'à la variation d'échantillonnage ").
Avec ces 2 hypothèses à l'esprit, nous pouvons maintenant mettre en place un test puissant , en choisissant une statistique de test dont les valeurs typiques sous l'alternative sont peu probables sous le zéro. (Une statistique t positive à 2 échantillons loin de 0 ne serait pas surprenante si l'alternative est vraie, mais surprenante si la valeur null est vraie.) Ensuite, nous calculons la distribution d'échantillonnage de la statistique de test sous la valeur nulle, afin que nous puissions calculer les valeurs p --- et les interpréter. Lorsque nous observons une statistique de test peu probable sous la valeur nulle, en particulier si le plan d'étude, la taille de l'échantillon, etc. ont été choisis pour avoir une puissance élevée , cela fournit des preuves de l'alternative.
Alors, pourquoi ne parlons-nous pas «d'accepter» l'hypothèse alternative? Parce que même une étude de grande puissance ne fournit pas tout à fait rigoureuse preuve que le nul est erroné. C'est toujours une sorte de preuve, mais plus faible que d'autres types de preuves.
la source
Historiquement, il y avait un désaccord sur la nécessité d'une hypothèse alternative. Permettez-moi d'expliquer ce point de désaccord en considérant les opinions de Fisher et Neyman, dans le contexte des statistiques fréquentistes, et une réponse bayésienne.
Fisher - Nous n'avons pas besoin d'une autre hypothèse; nous pouvons simplement tester une hypothèse nulle en utilisant un test d'adéquation. Le résultat est une valeurp , fournissant une mesure de la preuve de l'hypothèse nulle.
Neyman - Nous devons effectuer un test d'hypothèse entre un nul et une alternative. Le test est tel qu'il entraînerait des erreurs de type 1 à un taux fixe et prédéterminé,α . Le résultat est une décision - rejeter ou ne pas rejeter l'hypothèse nulle au niveau α .
Nous avons besoin d'une alternative du point de vue théorique de la décision - nous faisons un choix entre deux plans d'action - et parce que nous devons rapporter la puissance du test1 - p ( Acceptez H0|H1)
Nous devons rechercher les tests les plus puissants possibles pour avoir les meilleures chances de rejeterH0 lorsque l'alternative est vraie.
Pour satisfaire ces deux points, l'hypothèse alternative ne peut pas être la vague «pasH0 ».
Bayésien - Nous devons considérer au moins deux modèles et mettre à jour leur plausibilité relative avec les données. Avec un seul modèle, nous avons simplementp ( H0) = 1
quelles que soient les
données que nous collectons. Pour effectuer des calculs dans ce cadre, l'hypothèse alternative (ou modèle tel qu'il serait connu dans ce contexte) ne peut être celle mal définie «pas H0 ». Je l'appelle mal défini car nous ne pouvons pas écrire le modèle p ( données | pas H0) .
la source
Je ne suis pas sûr à 100% s'il s'agit d'une exigence formelle, mais généralement l' hypothèse nulle et l' hypothèse alternative sont: 1) complémentaires et 2) exhaustives. C'est-à-dire: 1) elles ne peuvent pas être toutes les deux vraies en même temps; 2) si l'un n'est pas vrai, l'autre doit être vrai.
Envisagez un simple test de hauteur entre les filles et les garçons. Une hypothèse nulle typique dans ce cas est queheightboys=heightgirls . Une autre hypothèse serait heightboys≠heightgirls . Donc, si null n'est pas vrai, l'alternative doit être vraie.
la source
Dans un test d'hypothèse classique, le seul rôle mathématique joué par l'hypothèse alternative est qu'elle affecte l'ordre des preuves à travers la statistique de test choisie. L'hypothèse alternative est utilisée pour déterminer la statistique de test appropriée pour le test, ce qui équivaut à établir un classement ordinal de tous les résultats de données possibles de ceux les plus propices à l'hypothèse nulle (par rapport à l'alternative indiquée) à ceux les moins propices aux hypothèses nulles (contre l'alternative indiquée). Une fois que vous avez formé ce classement ordinal des résultats de données possibles, l'hypothèse alternative ne joue plus de rôle mathématique dans le test .
Explication formelle: En tout test d'hypothèse classique avecn valeurs de données observables x=(x1,...,xn) vous avez une statistique de test T:Rn→R qui cartographie tous les résultats possibles des données sur une échelle ordinale qui mesure si elle est plus propice à l'hypothèse nulle ou alternative. (Sans perte de généralité, nous supposerons que des valeurs plus faibles sont plus propices à l'hypothèse nulle et des valeurs plus élevées sont plus propices à l'hypothèse alternative. Nous disons parfois que des valeurs plus élevées de la statistique de test sont "plus extrêmes" dans la mesure où elles constituent plus extrêmes preuve de l'hypothèse alternative.) La valeur de p du test est alors donnée par:
Cette fonction de valeur p détermine entièrement les preuves du test pour tout vecteur de données. Lorsqu'il est combiné avec un niveau de signification choisi, il détermine le résultat du test pour tout vecteur de données. (Nous l'avons décrit pour un nombre fixe de points de donnéesn mais cela peut facilement être étendu pour permettre un arbitraire n .) Il est important de noter que la valeur de p n'est affectée par la statistique de test que par l'échelle ordinale qu'elle induit, donc si vous appliquez une transformation augmentant de façon monotone aux statistiques de test, cela ne fait aucune différence pour le test d'hypothèse (c'est-à-dire qu'il s'agit du même test). Cette propriété mathématique ne fait que refléter le fait que le seul but de la statistique de test est d'induire une échelle ordinale sur l'espace de tous les vecteurs de données possibles, pour montrer lesquels sont plus propices à la valeur nulle / alternative.
L'hypothèse alternative n'affecte cette mesure que par la fonctionT , qui est choisie en fonction des hypothèses nulles et alternatives énoncées dans le modèle global. On peut donc considérer la fonction statistique de test comme une fonction T≡g(M,H0,HA) du modèle global M et des deux hypothèses. Par exemple, pour un test de rapport de vraisemblance, la statistique de test est formée en prenant un rapport (ou logarithme d'un rapport) de supremums de la fonction de vraisemblance sur des plages de paramètres relatives aux hypothèses nulles et alternatives.
Qu'est-ce que cela signifie si nous comparons des tests avec différentes alternatives? Supposons que vous avez un modèle fixeM et que vous voulez faire deux tests d'hypothèses différentes comparant la même hypothèse nulle H0 contre deux alternatives différentes HA et H′A . Dans ce cas, vous aurez deux fonctions statistiques de test différentes:
conduisant aux fonctions de valeur p correspondantes:
Il est important de noter que siT et T′ sont des transformations monotones croissantes l'une de l'autre, alors les fonctions de valeur p et p′ sont identiques, donc les deux tests sont le même test. Si les fonctions T et T′ ne sont pas des transformations croissantes monotones l'une de l'autre, alors nous avons deux tests d'hypothèse vraiment différents.
la source
La raison pour laquelle vous formulez une autre hypothèse est que vous aviez probablement une expérience en tête avant de commencer l'échantillonnage. La formulation d'une hypothèse alternative peut également décider si vous utilisez un test unilatéral ou bilatéral et donc vous donner plus de puissance statistique (dans le scénario unilatéral). Mais techniquement, pour exécuter le test, vous n'avez pas besoin de formuler une hypothèse alternative, vous avez juste besoin de données.
la source