Supposons que j'ai un -vecteur Y de variables dépendantes et un N -vecteur X de variable indépendante. Lorsque Y est tracé contre 1NYNXY , je vois qu'il y a une relation linéaire (tendance à la hausse) entre les deux. Maintenant, cela aussi signifie qu'il ya une tendancebaisse linéaire entreYetX.1XYX
Maintenant, si je lance la régression:
et obtenir la valeur ajustée Y = β XY=β∗X+ϵOui^= β^X
Ensuite, je lance la régression: etobtenir la valeur ajustée ~ Y = α 1Oui= α ∗ 1X+ ϵOui~= α^1X
Est-ce que les deux valeurs et ~ Y être à peu près égale?Oui^Oui~
Lorsque Y est tracé contre , je vois qu'il y a une relation linéaire (tendance à la hausse) entre les deux. Maintenant, cela signifie également qu'il existe une tendance linéaire à la baisse entre Y et X1X
La dernière phrase est fausse: il y a une tendance à la baisse, mais elle n'est en aucun cas linéaire:
J'ai utilisé un en fonction plus un peu de bruit surY. Comme vous pouvez le voir, tout en traçantYcontre1F( x ) = 1XOuiOui donne un comportement linéaire,YcontreXest loin d'être linéaire.1XOuiX
(@whuber souligne que le contre 1Oui intrigue X n'a pas l'air homoscédastique. Je pense qu'il semble y avoir une variance plus élevée pour unYfaiblecar la densité de cas beaucoup plus élevée conduit à une plus grande plage, ce qui est essentiellement ce que nous percevons. En fait, les données sont homoscédastiques: j'avais l'habitudede générer les données, donc pas de dépendance sur la taille deX.)1XOuiY = 1 / X + rnorm (length (X), sd = 0.1)X
Donc, en général, la relation est très non linéaire. Autrement dit, à moins que votre plage de soit si étroite que vous pouvez approximer d 1XVoici un exemple:ré1XréX= - 1X2≈ c o n s t .
Conclusion:
En général, il est très difficile d'approcher un Fonction de type X par une fonction linéaire ou polynomiale. Et sans terme de décalage, vous n'obtiendrez jamais une approximation raisonnable.1X
Si l' intervalle est suffisamment étroit pour permettre une approximation linéaire, vous ne serez de toute façon pas en mesure, à partir des données, de deviner que la relation devrait être 1X1XX
@whuber: Je suis totalement désolé mais semble être assez dense en ce moment. La question dit: "Quand Y est tracé contre 1 / X, je vois qu'il y a une relation linéaire (tendance à la hausse)". C'est ce que j'ai essayé de représenter dans la 1ère et la 3ème image: Y sur 1 / X augmentant linéairement. J'ai ensuite tracé le Y correspondant sur X (non linéaire, décroissant). Où est-ce que je comprends mal l'OP?
cbeleites mécontents de SX
1
Oui1 / X
Merci pour les observations sur l'homoscédasticité. En transformant la variable indépendante , vous ne modifiez pas l'homoscédasticité de la réponse - mais son apparence peut certainement changer, comme vous le faites remarquer, ce qui est utile à savoir. (Nous avons vu ce phénomène dans plusieurs autres articles, où les gens attribuent à tort l'hétéroscédasticité à de simples différences dans les populations du groupe, par exemple.)
whuber
Réponse et commentaires très approfondis! Merci @cbeleites et @whuber!
Mayou
2
Je ne vois aucune raison pour qu'ils soient "approximativement égaux" en général - mais qu'entendez-vous exactement par approximativement égaux?
Voici un exemple de jouet:
library(ggplot2)
n <- 10^3
df <- data.frame(x=runif(n, min=1, max=2))
df$y <- 5 / df$x + rnorm(n)
p <- (ggplot(df, aes(x=x, y=y)) +
geom_point() +
geom_smooth(method="lm", formula=y ~ 0 + x) + # Blue, OP's y hat
geom_smooth(method="lm", formula=y ~ 0 + I(x^-1), color="red")) # Red, OP's y tilde
p
L'image:
Le modèle "bleu" ferait beaucoup mieux s'il était autorisé à avoir un terme d'interception (c'est-à-dire constant) ...
Il est difficile de dire ce que vous faites avec le modèle bleu, mais cela ne ressemble certainement pas à ce que l'OP décrit! Le rouge est beaucoup plus proche de la situation présentée dans la question.
Je ne vois aucune raison pour qu'ils soient "approximativement égaux" en général - mais qu'entendez-vous exactement par approximativement égaux?
Voici un exemple de jouet:
L'image:
Le modèle "bleu" ferait beaucoup mieux s'il était autorisé à avoir un terme d'interception (c'est-à-dire constant) ...
la source