Puis-je prouver une relation curviligne lorsque la variable indépendante linéaire n'est pas significative

8

J'étudie un effet curviligne entre X et Y en utilisant une analyse de régression hiérarchique. Pour tester les effets curvilignes, le terme au carré pour X a été calculé (je veux dire le centre aussi la variable X).

Dans le modèle 1, les variables de contrôle ont été saisies. Dans le modèle 2, X (linéaire) a été entré. Dans le modèle 3, X (quadratique) a été entré.

Dans le modèle 2, X linéaire est significatif. Lorsque le terme carré est entré dans le modèle 3, le terme quadratique est significatif mais pas le terme linéaire. Cela prouve-t-il un effet curviligne? Ou est-il essentiel que dans le modèle 3, les deux (linéaire et quadratique) soient significatifs?

Quand je ne veux pas centrer la variable indépendante, le modèle 3 a déclaré X linéaire et X quadratique significatif. Le problème ici est les problèmes de multicolinéarité.

Sanne
la source

Réponses:

6

Non, il n'est pas essentiel que les termes linéaire et quadratique soient significatifs. Seul le terme quadratique doit être significatif.

En fait, il est important de noter que le terme linéaire prend une interprétation quelque peu différente dans le contexte d'un modèle qui inclut également le terme quadratique. Dans un tel modèle, le terme linéaire représente maintenant la pente de la ligne tangente à x à l'ordonnée à l'origine, c'est-à-dire la pente prévue de x lorsque et seulement lorsque x = 0 . Ainsi, un test du terme linéaire dans un modèle comme celui-ci ne teste généralement pas la même chose que dans un modèle qui inclut simplement le terme linéaire sans le quadratique.

Jake Westfall
la source
0

Réfléchissez à ce que signifie la signification. Une relation de la forme que vous proposez peut être caractérisée comme et estimée empiriquement comme .Y=a1X2+a2X+bY^=α1X^2+α2X^+β+ϵ

Que signifie la signification d'une estimation - disons, -? La signification est Pr (données | H0), et étant donné une probabilité "non significative", ce que vous ne rejetez vraiment pas, c'est la possibilité que le coefficient soit vraiment nul.α2

Cela invalide-t-il l'hypothèse d'une relation curviligne? Pas à mon avis. Il semble plutôt suggérer que est vraiment nul.a2

Prenons l'exemple suivant (écrit en Stata).

Nous générons d'abord quelques données:

set obs 20000
gen x = uniform()
gen control_one = uniform()
gen control_two = uniform()
drawnorm e, m(0) sd(0.5)

Nous spécifions ensuite une nouvelle variable X = x ^ 2 et une relation pour une variable de résultat Y

gen Y = control_one+control_two+X+e

(Cela correspond à un modèle curviligne multidimensionnel en x avec un coefficient du terme linéaire et constant égal à zéro).

Nous effectuons ensuite quelques régressions:

reg Y control_one control_two
reg Y control_one control_two x
reg Y control_one control_two X x

Le terme x est significatif dans le deuxième modèle, mais pas dans le troisième. Autant que je sache, cela reflète votre expérience avec des données réelles.

abaumann
la source
0

Il n'est en fait pas essentiel que l'un ou l'autre terme soit significatif, mais vous ne prouvez jamais rien avec juste un modèle.

Les estimations des coefficients données sont des estimations et elles fournissent des preuves. Un grand coefficient sur le terme quadratique fournit beaucoup de preuves, un petit coefficient fournit un peu de preuves, d'une relation curviligne. Le terme linéaire n'est pas pertinent. Il peut être positif, négatif, proche de 0 ou autre.

Un tracé des données fournira également des preuves d'une relation curviligne.

La signification statistique signifie une chose très précise: si , dans la population dont cet échantillon a été tiré, l'effet était vraiment nul, y a-t-il 5% de chances que, dans un échantillon de la taille disponible, une statistique de test à ce jour ou plus loin de 0 serait obtenu.

Peter Flom
la source
0

Comme indiqué précédemment, la signification du terme curviligne est autonome, quelle que soit la signification du terme linéaire dans la régression. Si le terme linéaire est proche de zéro, alors la courbe est un U ou un U inversé s'il est significatif. Si les deux termes sont significatifs, la ligne résultante ressemble plus à une colline avec une pente accélératrice (ou décélératrice).

StatisticsDoc Consulting
la source