Régression avec variable indépendante inverse

10

Supposons que j'ai un -vecteur Y de variables dépendantes et un N -vecteur X de variable indépendante. Lorsque Y est tracé contre 1NOuiNXOui , je vois qu'il y a une relation linéaire (tendance à la hausse) entre les deux. Maintenant, cela aussi signifie qu'il ya une tendancebaisse linéaire entreYetX.1XYX

Maintenant, si je lance la régression: et obtenir la valeur ajustée Y = β XY=βX+ϵOui^=β^X

Ensuite, je lance la régression: etobtenir la valeur ajustée ~ Y = α 1Oui=α1X+ϵOui~=α^1X

Est-ce que les deux valeurs et ~ Y être à peu près égale?Oui^Oui~

Mayou
la source

Réponses:

10

 Lorsque Y est tracé contre , je vois qu'il y a une relation linéaire (tendance à la hausse) entre les deux. Maintenant, cela signifie également qu'il existe une tendance linéaire à la baisse entre Y et X1X

La dernière phrase est fausse: il y a une tendance à la baisse, mais elle n'est en aucun cas linéaire: Y ~ 1 / X Y ~ X

J'ai utilisé un en fonction plus un peu de bruit surY. Comme vous pouvez le voir, tout en traçantYcontre1F(X)=1XOuiOui donne un comportement linéaire,YcontreXest loin d'être linéaire.1XOuiX

(@whuber souligne que le contre 1Oui intrigue X n'a pas l'air homoscédastique. Je pense qu'il semble y avoir une variance plus élevée pour unYfaiblecar la densité de cas beaucoup plus élevée conduit à une plus grande plage, ce qui est essentiellement ce que nous percevons. En fait, les données sont homoscédastiques: j'avais l'habitudede générer les données, donc pas de dépendance sur la taille deX.)1XOuiY = 1 / X + rnorm (length (X), sd = 0.1)X

Donc, en général, la relation est très non linéaire. Autrement dit, à moins que votre plage de soit si étroite que vous pouvez approximer d 1XVoici un exemple:1XX=-1X2const.

Y ~ 1 / X Y ~ X

Conclusion:

  • En général, il est très difficile d'approcher un Fonction de type X par une fonction linéaire ou polynomiale. Et sans terme de décalage, vous n'obtiendrez jamais une approximation raisonnable.1X
  • Si l' intervalle est suffisamment étroit pour permettre une approximation linéaire, vous ne serez de toute façon pas en mesure, à partir des données, de deviner que la relation devrait être 1X1XX
cbeleites mécontents de SX
la source
OuiXOui1/XOuiX
2
@whuber: Je suis totalement désolé mais semble être assez dense en ce moment. La question dit: "Quand Y est tracé contre 1 / X, je vois qu'il y a une relation linéaire (tendance à la hausse)". C'est ce que j'ai essayé de représenter dans la 1ère et la 3ème image: Y sur 1 / X augmentant linéairement. J'ai ensuite tracé le Y correspondant sur X (non linéaire, décroissant). Où est-ce que je comprends mal l'OP?
cbeleites mécontents de SX
1
Oui1/X
Merci pour les observations sur l'homoscédasticité. En transformant la variable indépendante , vous ne modifiez pas l'homoscédasticité de la réponse - mais son apparence peut certainement changer, comme vous le faites remarquer, ce qui est utile à savoir. (Nous avons vu ce phénomène dans plusieurs autres articles, où les gens attribuent à tort l'hétéroscédasticité à de simples différences dans les populations du groupe, par exemple.)
whuber
Réponse et commentaires très approfondis! Merci @cbeleites et @whuber!
Mayou
2

Je ne vois aucune raison pour qu'ils soient "approximativement égaux" en général - mais qu'entendez-vous exactement par approximativement égaux?

Voici un exemple de jouet:

library(ggplot2)
n <- 10^3
df <- data.frame(x=runif(n, min=1, max=2))
df$y <- 5 / df$x + rnorm(n)
p <- (ggplot(df, aes(x=x, y=y)) +
      geom_point() +
      geom_smooth(method="lm", formula=y ~ 0 + x) +  # Blue, OP's y hat
      geom_smooth(method="lm", formula=y ~ 0 + I(x^-1), color="red"))  # Red, OP's y tilde
p

L'image:

Je dirais que ce sont loin d'être "approximativement égaux"

Le modèle "bleu" ferait beaucoup mieux s'il était autorisé à avoir un terme d'interception (c'est-à-dire constant) ...

Adrian
la source
Il est difficile de dire ce que vous faites avec le modèle bleu, mais cela ne ressemble certainement pas à ce que l'OP décrit! Le rouge est beaucoup plus proche de la situation présentée dans la question.
whuber
Oui1/XOuiXOui1/X