J'essaie de comprendre l'utilisation de la régression logistique dans les tables de contingence 2x2 et Ix2. Par exemple, en utilisant cela comme exemple
Quelle est la différence entre l'utilisation du test du chi carré et l'utilisation de la régression logistique? Qu'en est-il d'une table avec plusieurs facteurs nominaux (table Ix2) comme ceci:
Il y a une question similaire ici - mais la réponse est principalement que le chi carré peut gérer les tables mxn, mais ma question est de savoir ce qui est spécifique quand il y a un résultat binaire et un seul facteur nominal. (Le thread lié fait également référence à ce thread , mais il s'agit de plusieurs variables / facteurs).
S'il ne s'agit que d'un seul facteur (c'est-à-dire qu'il n'est pas nécessaire de contrôler d'autres variables) avec une réponse binaire, quelle est la différence de but de la régression logistique?
la source
Réponses:
En fin de compte, ce sont des pommes et des oranges.
La régression logistique est un moyen de modéliser une variable nominale en tant que résultat probabiliste d'une ou plusieurs autres variables. L'ajustement d'un modèle de régression logistique peut être suivi en testant si les coefficients du modèle sont significativement différents de 0, en calculant les intervalles de confiance pour les coefficients ou en examinant dans quelle mesure le modèle peut prédire de nouvelles observations.
Le test d'indépendance χ² est un test de signification spécifique qui teste l'hypothèse nulle selon laquelle deux variables nominales sont indépendantes.
L'utilisation d'une régression logistique ou d'un test χ² dépend de la question à laquelle vous souhaitez répondre. Par exemple, un test χ² pourrait vérifier s'il est déraisonnable de croire que le parti politique enregistré d'une personne est indépendant de sa race, tandis que la régression logistique pourrait calculer la probabilité qu'une personne avec une race, un âge et un sexe donnés appartient à chaque parti politique .
la source