Ma compréhension est que même la régression ne donne pas de causalité. Il ne peut donner qu'une association entre la variable y et les variables x et éventuellement une direction. Ai-je raison? J'ai souvent trouvé des expressions similaires à "x prédit y" même dans la plupart des manuels de cours et sur diverses pages de cours en ligne. Et vous appelez souvent les régresseurs comme prédicteurs et le y comme réponse.
- Est-il juste de l'utiliser pour une régression linéaire?
- Et la régression logistique? (si j'ai un seuil t avec lequel je peux comparer la probabilité?)
Réponses:
Il n'y a aucun problème à utiliser le mot "prédire".
Il est important de reconnaître que les prévisions ne sont pas liées à la causalité. Prenons un cas où la plupart des personnes décédées dans une salle d'urgence d'un hôpital meurent d'une crise cardiaque. Si vous apprenez qu'un patient est décédé, mais que vous n'en connaissiez pas la cause, vous pourriez prédire qu'il s'agissait probablement d'une crise cardiaque, car vous savez que les crises cardiaques sont responsables de> 50%. Vous faites une prédiction, mais vous prédisez une cause inconnue à partir d'un effet connu. De plus, la prédiction dans cet exemple est catégorique, elle est donc analogue à la régression logistique. (L'analogie est probablement plus forte que la régression logistique multinomiale , mais cela n'a pas d'importance ici.)
Pour ce que ça vaut, les prédictions n'ont pas du tout à être liées à un lien de causalité direct. Vous pouvez faire une prédiction basée sur une fausse corrélation, tant que la relation est fiable. Envisagez de prédire la hauteur inconnue d'un jumeau identique en fonction de son frère. Dans ce cas, les deux hauteurs sont les effets d'un ensemble de causes communes (génétique et environnement partagés). La hauteur des deux jumeaux n'est pas une cause ou un effet de l'autre. Néanmoins, vous pouvez faire de très bonnes prédictions dans cette situation.
la source