Pourquoi avons-nous besoin d'hypothèses alternatives?

14

Lorsque nous faisons des tests, nous nous retrouvons avec deux résultats.

1) Nous rejetons l'hypothèse nulle

2) Nous ne rejetons pas l'hypothèse nulle.

Nous ne parlons pas d'accepter des hypothèses alternatives. Si nous ne parlons pas d'accepter une hypothèse alternative, pourquoi devons-nous avoir une hypothèse alternative?

Voici la mise à jour: Quelqu'un pourrait-il me donner deux exemples:

1) rejeter l'hypothèse nulle équivaut à accepter l'hypothèse alternative

2) rejeter l'hypothèse nulle n'est pas égal à accepter l'hypothèse alternative

user1700890
la source
1
Parce que vous essayez de tirer des conclusions. Si ce n'est pas l'hypothèse nulle, alors c'est peut-être l'hypothèse alternative (même si vous n'êtes pas complètement sûr que l'hypothèse alternative est valide, si vous rejetez l'hypothèse nulle). Lorsque vous rejetez l'hypothèse nulle, vous dites que vous avez des "preuves" pour conclure que l'hypothèse alternative peut être vraie.
nbro
@nbro, merci, j'ai ajouté une question à mon message d'origine. Pourriez-vous jeter un œil?
user1700890
1
Je ne connais pas très bien les tests d'hypothèses en général. Il vaut mieux attendre qu'une personne plus compétente réponde à vos questions.
nbro
Si votre hypothèse alternative est un complément de l'hypothèse nulle, il est inutile de l'utiliser du tout. Personne n'utilise d'hypothèse alternative dans la pratique pour ces raisons en dehors des manuels.
Aksakal
"Nous ne parlons pas d'accepter des hypothèses alternatives" - pas vrai pour tous les "nous" possibles. Certaines personnes parlent d'accepter l'hypothèse alternative, et beaucoup d'autres la pensent , même si elles respectent le tabou de ne pas le dire . Il est quelque peu pédant d'éviter de parler d'accepter l'hypothèse alternative lorsqu'il n'y a aucun doute raisonnable qu'elle est vraie. Mais, étant donné que les statistiques sont si susceptibles d'être utilisées à mauvais escient, dans ce cas, la pédanterie est probablement une bonne chose dans la mesure où elle incite à la prudence dans l'interprétation des résultats.
John Coleman

Réponses:

8

Je vais me concentrer sur "Si nous ne parlons pas d'accepter une hypothèse alternative, pourquoi devons-nous avoir une hypothèse alternative?"

Parce que cela nous aide à choisir une statistique de test significative et à concevoir notre étude pour avoir une puissance élevée --- une grande chance de rejeter le zéro lorsque l'alternative est vraie. Sans alternative, nous n'avons pas de concept de pouvoir.

Imaginez que nous n'avons qu'une hypothèse nulle et aucune alternative. Ensuite, il n'y a aucune indication sur la façon de choisir une statistique de test qui aura une puissance élevée. Tout ce que nous pouvons dire, c'est: «Rejetez la valeur nulle chaque fois que vous observez une statistique de test dont la valeur est peu probable sous la valeur nulle». Nous pouvons choisir quelque chose d'arbitraire: nous pourrions dessiner des nombres aléatoires uniformes (0,1) et rejeter le nul lorsqu'ils sont inférieurs à 0,05. Cela se produit sous le null "rarement", pas plus de 5% du temps --- mais c'est aussi tout aussi rare lorsque le null est faux. Il s'agit donc techniquement d'un test statistique, mais il n'a aucun sens comme preuve pour ou contre quoi que ce soit.

Au lieu de cela, nous avons généralement une hypothèse alternative scientifiquement plausible ("Il y a une différence positive dans les résultats entre les groupes de traitement et de contrôle dans mon expérience"). Nous aimerions le défendre contre des critiques potentiels qui pourraient faire l'hypothèse nulle en tant que défenseurs du diable ("Je ne suis pas encore convaincu --- peut-être que votre traitement fait mal, ou n'a aucun effet du tout , et toute différence apparente dans la les données ne sont dues qu'à la variation d'échantillonnage ").

Avec ces 2 hypothèses à l'esprit, nous pouvons maintenant mettre en place un test puissant , en choisissant une statistique de test dont les valeurs typiques sous l'alternative sont peu probables sous le zéro. (Une statistique t positive à 2 échantillons loin de 0 ne serait pas surprenante si l'alternative est vraie, mais surprenante si la valeur null est vraie.) Ensuite, nous calculons la distribution d'échantillonnage de la statistique de test sous la valeur nulle, afin que nous puissions calculer les valeurs p --- et les interpréter. Lorsque nous observons une statistique de test peu probable sous la valeur nulle, en particulier si le plan d'étude, la taille de l'échantillon, etc. ont été choisis pour avoir une puissance élevée , cela fournit des preuves de l'alternative.

Alors, pourquoi ne parlons-nous pas «d'accepter» l'hypothèse alternative? Parce que même une étude de grande puissance ne fournit pas tout à fait rigoureuse preuve que le nul est erroné. C'est toujours une sorte de preuve, mais plus faible que d'autres types de preuves.

civilstat
la source
7

Historiquement, il y avait un désaccord sur la nécessité d'une hypothèse alternative. Permettez-moi d'expliquer ce point de désaccord en considérant les opinions de Fisher et Neyman, dans le contexte des statistiques fréquentistes, et une réponse bayésienne.

  • Fisher - Nous n'avons pas besoin d'une autre hypothèse; nous pouvons simplement tester une hypothèse nulle en utilisant un test d'adéquation. Le résultat est une valeur p , fournissant une mesure de la preuve de l'hypothèse nulle.

  • Neyman - Nous devons effectuer un test d'hypothèse entre un nul et une alternative. Le test est tel qu'il entraînerait des erreurs de type 1 à un taux fixe et prédéterminé, α . Le résultat est une décision - rejeter ou ne pas rejeter l'hypothèse nulle au niveau α .

    Nous avons besoin d'une alternative du point de vue théorique de la décision - nous faisons un choix entre deux plans d'action - et parce que nous devons rapporter la puissance du test

    1-p(J'accepte H0|H1)
    Nous devons rechercher les tests les plus puissants possibles pour avoir les meilleures chances de rejeterH0 lorsque l'alternative est vraie.

    Pour satisfaire ces deux points, l'hypothèse alternative ne peut pas être la vague «pas H0 ».

  • Bayésien - Nous devons considérer au moins deux modèles et mettre à jour leur plausibilité relative avec les données. Avec un seul modèle, nous avons simplement

    p(H0)=1
    quelles que soient les données que nous collectons. Pour effectuer des calculs dans ce cadre, l'hypothèse alternative (ou modèle tel qu'il serait connu dans ce contexte) ne peut être celle mal définie «pas H0 ». Je l'appelle mal défini car nous ne pouvons pas écrire le modèle p(Les données|ne pas H0) .

insatisfait
la source
1
Votre dernier point est excellent, et souvent négligé dans les publications qui fondent toute leur argumentation sur un seul NHST non motivé.
Konrad Rudolph
Pourquoi «pas » est-il mal défini? H0
Michael
Qu'Est-ce que c'est? Pouvez-vous calculer ? p(data|notH0)
innisfree le
@innisfree sous conception fréquentiste non, mais probablement sous bayésien.
Michael
Essayez de faire cela sans introduire au moins 2 modèles ...
innisfree
4

Je ne suis pas sûr à 100% s'il s'agit d'une exigence formelle, mais généralement l' hypothèse nulle et l' hypothèse alternative sont: 1) complémentaires et 2) exhaustives. C'est-à-dire: 1) elles ne peuvent pas être toutes les deux vraies en même temps; 2) si l'un n'est pas vrai, l'autre doit être vrai.

Envisagez un simple test de hauteur entre les filles et les garçons. Une hypothèse nulle typique dans ce cas est que heightboys=heightgirls . Une autre hypothèse serait heightboysheightgirls . Donc, si null n'est pas vrai, l'alternative doit être vraie.

Karolis Koncevičius
la source
1
Je suis entièrement d'accord avec vos affirmations, mais il convient de noter que et H a sont généralement des ensembles infiniment grands d'hypothèses nulles. Il semble aussi que beaucoup sont convaincus que H 0 et H un besoin de ne pas être exhaustive, voir par exemple ce ou cette discussion. H0HaH0Ha
bi_scholar
2
@bi_scholar merci pour les fils de discussion. Je ne suis pas un expert en la matière, mais sur la base d'un raisonnement simple, je pense qu'ils doivent être exhaustifs. Considérez ce test étrange: quelqu'un trouve 5 rochers disposés dans l'ordre sur une route. Son : le vent l'a fait. Son H 1 : c'était des extraterrestres. Maintenant, s'il teste la chance que le vent a fait cela et trouve une probabilité de 0,0001 - il rejette l'hypothèse du vent. Mais cela ne lui donne pas le droit de prétendre qu'il s'agissait d'étrangers. Tout ce qu'il peut affirmer, c'est que le risque de vent est faible. Mais TOUTE autre explication reste ouverte. H0H1
Karolis Koncevičius
1
Je suis d'accord. Mon raisonnement était que le test d'hypothèse consiste à accepter ou à rejeter tout en rejetant ou en acceptant H a . Si H 0 et H a ne sont pas exhaustifs, il est inutile de définir un H a du tout, car même lorsque nous rejetons H 0 nous ne pouvons pas accepter H a , car il existe d'autres hypothèses en dehors de H 0 et H a qui pourraient être vrai aussi. Je n'ai malheureusement pas réussi à faire comprendre mon point de vue dans le premier fil. H0HaH0HaHaH0HaH0Ha
bi_scholar
1
@innisfree on pourrait tester deux hypothèses ponctuelles dans une sorte de cadre de vraisemblance - bien sûr. Mais cette procédure ne serait pas appelée "test d'hypothèse nulle" et elle est imprécise. Il sélectionnerait le plus proche comme étant vrai même dans les cas où aucun d'entre eux n'est vrai. En outre, concernant la puissance - on peut choisir une autre hypothèse ou taille d'effet lors du calcul de la puissance du test mais (à mon avis) devrait l'oublier une fois le test effectué. Sauf s'il existe des informations préalables qui l'informent des effets possibles présents dans les données. Comme peut-être des pixels blancs / noirs dans une photo bruyante.
Karolis Koncevičius
1
@innisfree Je suis curieux de savoir à quoi ressemblerait un tel test, pourriez-vous formuler un petit exemple? Je suis convaincu que l'on ne peut accepter en rejetant H 0 sauf si θ { 0 , 1 } qui correspond à H 0 et H 1 étant exhaustif. θ=1H0θ{0,1}H0H1
bi_scholar le
2

Pourquoi devons-nous avoir une hypothèse alternative?

Dans un test d'hypothèse classique, le seul rôle mathématique joué par l'hypothèse alternative est qu'elle affecte l'ordre des preuves à travers la statistique de test choisie. L'hypothèse alternative est utilisée pour déterminer la statistique de test appropriée pour le test, ce qui équivaut à établir un classement ordinal de tous les résultats de données possibles de ceux les plus propices à l'hypothèse nulle (par rapport à l'alternative indiquée) à ceux les moins propices aux hypothèses nulles (contre l'alternative indiquée). Une fois que vous avez formé ce classement ordinal des résultats de données possibles, l'hypothèse alternative ne joue plus de rôle mathématique dans le test .


Explication formelle: En tout test d'hypothèse classique avec n valeurs de données observables x=(x1,...,xn) vous avez une statistique de test T:RnRqui cartographie tous les résultats possibles des données sur une échelle ordinale qui mesure si elle est plus propice à l'hypothèse nulle ou alternative. (Sans perte de généralité, nous supposerons que des valeurs plus faibles sont plus propices à l'hypothèse nulle et des valeurs plus élevées sont plus propices à l'hypothèse alternative. Nous disons parfois que des valeurs plus élevées de la statistique de test sont "plus extrêmes" dans la mesure où elles constituent plus extrêmes preuve de l'hypothèse alternative.) La valeur de p du test est alors donnée par:

p(x)pT(x)P(T(X)T(x)|H0).

Cette fonction de valeur p détermine entièrement les preuves du test pour tout vecteur de données. Lorsqu'il est combiné avec un niveau de signification choisi, il détermine le résultat du test pour tout vecteur de données. (Nous l'avons décrit pour un nombre fixe de points de données n mais cela peut facilement être étendu pour permettre un arbitraire n .) Il est important de noter que la valeur de p n'est affectée par la statistique de test que par l'échelle ordinale qu'elle induit, donc si vous appliquez une transformation augmentant de façon monotone aux statistiques de test, cela ne fait aucune différence pour le test d'hypothèse (c'est-à-dire qu'il s'agit du même test). Cette propriété mathématique ne fait que refléter le fait que le seul but de la statistique de test est d'induire une échelle ordinale sur l'espace de tous les vecteurs de données possibles, pour montrer lesquels sont plus propices à la valeur nulle / alternative.

L'hypothèse alternative n'affecte cette mesure que par la fonction T , qui est choisie en fonction des hypothèses nulles et alternatives énoncées dans le modèle global. On peut donc considérer la fonction statistique de test comme une fonction Tg(M,H0,HA) du modèle global M et des deux hypothèses. Par exemple, pour un test de rapport de vraisemblance, la statistique de test est formée en prenant un rapport (ou logarithme d'un rapport) de supremums de la fonction de vraisemblance sur des plages de paramètres relatives aux hypothèses nulles et alternatives.


Qu'est-ce que cela signifie si nous comparons des tests avec différentes alternatives? Supposons que vous avez un modèle fixe M et que vous voulez faire deux tests d'hypothèses différentes comparant la même hypothèse nulle H0 contre deux alternatives différentes HA et HA . Dans ce cas, vous aurez deux fonctions statistiques de test différentes:

T=g(M,H0,HA)T=g(M,H0,HA),

conduisant aux fonctions de valeur p correspondantes:

p(x)=P(T(X)T(x)|H0)p(x)=P(T(X)T(x)|H0).

Il est important de noter que si T et T sont des transformations monotones croissantes l'une de l'autre, alors les fonctions de valeur p et p sont identiques, donc les deux tests sont le même test. Si les fonctions T et T ne sont pas des transformations croissantes monotones l'une de l'autre, alors nous avons deux tests d'hypothèse vraiment différents.

Ben - Réintègre Monica
la source
2
Je serais d'accord avec cela, en disant que le test est conçu pour rejeter l'hypothèse nulle face à des résultats extrêmes, et le rôle de l'hypothèse alternative est de pointer les résultats qui seraient considérés comme extrêmes si l'hypothèse nulle était vraie
Henry
1

P(data|H0)H0

α

La raison pour laquelle vous formulez une autre hypothèse est que vous aviez probablement une expérience en tête avant de commencer l'échantillonnage. La formulation d'une hypothèse alternative peut également décider si vous utilisez un test unilatéral ou bilatéral et donc vous donner plus de puissance statistique (dans le scénario unilatéral). Mais techniquement, pour exécuter le test, vous n'avez pas besoin de formuler une hypothèse alternative, vous avez juste besoin de données.

Stefan
la source
P(data|H0)P(data as extreme as that observed|H0)
@innisfree Je suis d'accord et c'est exactement comme cela que j'ai défini les données dans cette même phrase.
Stefan
? Je ne peux voir nulle part où les données sont définies (de cette façon ou de toute autre manière)
innisfree
Et même si c'était le cas, pourquoi faire ça? Pourquoi redéfinir les données de cette façon? Je conseillerais de clarifier les parties du texte autour de p (données ..
innisfree