Qu'est-ce qu'un modèle nul en régression et comment est-il lié à l'hypothèse nulle?

16

Qu'est-ce qu'un modèle nul en régression et quelle est la relation entre le modèle nul et l'hypothèse nulle?

Pour ma compréhension, cela signifie-t-il

  • Utiliser la «moyenne de la variable de réponse» pour prédire la variable de réponse continue?
  • Utiliser la «distribution d'étiquettes» pour prédire les variables de réponse discrètes?

Si tel est le cas, il semble qu'il manque les connexions entre l'hypothèse nulle.

Haitao Du
la source
4
Notez que dans R, vous pouvez essayer fit = lm(formula = y ~ 1, data) et vous devriez voir la moyenne de y. Voir également la réponse de MorganBall. Je serais le plus d'accord avec sa réponse. De plus, un modèle nul peut être un modèle avec p prédicteurs, un modèle alternatif étant un modèle avec p+k , où k peut être 1,2, ... covariables supplémentaires.
Jon
3
Voici une référence pour vous: onlinecourses.science.psu.edu/stat501/node/295
Jon

Réponses:

11

Non, je dirais que "modèle nul" a essentiellement la même signification que "hypothèse nulle": le modèle si l'hypothèse nulle est vraie. Ce que cela signifie, dans un cas particulier, dépend bien sûr de l'hypothèse nulle concrète.

Vos interprétations comme "la valeur moyenne" (vous voudrez probablement dire "la distribution marginale sur la variable de réponse") ne prenant en compte aucun prédicteur, est une possibilité, correspondant à l'hypothèse nulle d'un "test omnibus", testant tous les paramètres (sauf l'interception) simultanément.

Mais l'intérêt pourrait bien se concentrer sur un modèle de la forme x 1 contient les prédicteurs dont vous savez qu'ils affectent le résultat, donc vous ne voulez pas à tester, tandis que x 2 contient les prédicteurs que vous testez.

yi=β0+β1Tx1i+β2Tx2i+ϵi
x1x2

L'hypothèse nulle sera donc et le modèle nul serait y i = β 0 + β T 1 x 1 i + ϵ i . Cela dépend donc.β2=0yi=β0+β1Tx1i+ϵi

kjetil b halvorsen
la source
2
L'hypothèse nulle est généralement quelque chose de spécifique sur les valeurs des paramètres; Je dirais que le modèle nul serait l'hypothèse nulle plus toutes les hypothèses d'accompagnement sous lesquelles la distribution nulle de la statistique de test serait dérivée - ce sont les hypothèses qui contiennent la majeure partie du modèle. Par exemple, l'hypothèse nulle ne mentionne pas l'indépendance, mais je dirais certainement qu'elle fait partie du modèle nul.
Glen_b -Reinstate Monica
18

Un modèle nul est lié à une hypothèse nulle. Prenez le modèle univarié suivant:

Y=α+β1X+ϵ

Mon hypothèse nulle serait normalement que n'est statistiquement pas différent de zéro.β1

(hypothèse nulle)H0:β1=0

(hypothèse alternative)HA:β10

Pour un modèle linéaire univarié, comme celui ci-dessus, si nous rejetions l'hypothèse alternative, nous pourrions supprimer du modèle linéaire et nous nous retrouverions avecβ1X

Y=α+ϵ

Quel est votre modèle nul et le même que celui de la moyenne .Y

Morgan Ball
la source
1
Pour le dernier point, oui c'est exact. Dans R, vous pouvez le voir en comparant l'ordonnée à l'origine de lm(y ~ 1, data)et mean(y).
Jon
2
+1 Belle réponse Morgan! J'ai pris la liberté de modifier un peu votre notation, car elle avait l'air bizarre.
Alexis
9

Dans la régression comme décrit partiellement dans les deux autres réponses, le modèle nul est l'hypothèse nulle que tous les paramètres de régression sont 0. Vous pouvez donc interpréter cela comme disant que sous l'hypothèse nulle il n'y a pas de tendance et la meilleure estimation / prédicteur d'un nouveau l'observation est la moyenne qui est 0 en cas d'absence d'interception.

Michael R. Chernick
la source
1
This answer helped me to understand null = 0 in coefficients (other than intercept), Thanks!
Haitao Du
1
also, the model can be the intercept only model, compared to another model.
D_Williams
1
+1, this is a useful addition to the thread. However, I would say that this is a specific & very restrictive use of the term "null model". The term is often (most of the time in my guess) used more loosely.
gung - Reinstate Monica