Je fais une régression linéaire avec une variable dépendante transformée. La transformation suivante a été effectuée pour que l'hypothèse de normalité des résidus soit maintenue. La variable dépendante non transformée a été biaisée négativement, et la transformation suivante l'a rendue proche de la normale:
où est la variable dépendante de l'échelle d'origine.
Je pense qu'il est logique d'utiliser une certaine transformation sur les coefficients pour revenir à l'échelle d'origine. En utilisant l'équation de régression suivante,
et en fixant , on a
Et enfin,
En utilisant la même logique, j'ai trouvé
Maintenant, les choses fonctionnent très bien pour un modèle avec 1 ou 2 prédicteurs; les coefficients rétrotransformés ressemblent à ceux d'origine, seulement maintenant je peux faire confiance aux erreurs standard. Le problème survient lors de l'inclusion d'un terme d'interaction, tel que
Ensuite, la rétrotransformation pour les s n'est pas si proche de celles de l'échelle d'origine, et je ne sais pas pourquoi cela se produit. Je ne sais pas non plus si la formule trouvée pour retransformer un coefficient bêta est utilisable comme c'est le cas pour le 3e β (pour le terme d'interaction). Avant d'entrer dans l'algèbre folle, j'ai pensé demander conseil ...
la source
Réponses:
Un problème est que vous avez écrit
Il s'agit d'un simple modèle déterministe (c'est-à-dire non aléatoire). Dans ce cas, vous pouvez retourner les coefficients sur l'échelle d'origine, car il ne s'agit que d'une simple algèbre. Mais, dans la régression habituelle, vous n'avez que ; vous avez laissé le terme d'erreur hors de votre modèle. Si la transformation de Y vers Y o r i g est non linéaire, vous pouvez avoir un problème puisque E ( fE(Y|X)=α+β⋅X Y Yorig , en général. Je pense que cela peut avoir à voir avec l'écart que vous voyez.E(f(X))≠f(E(X))
Modifier: notez que si la transformation est linéaire, vous pouvez revenir en arrière pour obtenir des estimations des coefficients sur l'échelle d'origine, car l'espérance est linéaire.
la source
Je salue vos efforts ici, mais vous aboyez le mauvais arbre. Vous ne soutenez pas la transformation des bêtas. Votre modèle tient dans le monde des données transformé. Si vous voulez faire une prédiction, par exemple, vous Reprenez y i , mais c'est tout. Bien sûr, vous pouvez également obtenir un intervalle de prédiction en calculant les valeurs limites hautes et basses, puis les retransformer également, mais en aucun cas ne retransformez-vous les bêtas.y^je
la source
ASK QUESTION
); il y aura plus de ressources pour répondre, vous obtiendrez l'attention de plus de CVers, et l'information sera mieux accessible pour la postérité.