Régression avec uniquement des variables catégorielles

24

Est-il possible d'effectuer une régression si toutes les variables dépendantes et indépendantes sont des variables catégorielles?

altruiste
la source
3
C'est certainement possible, même pour une régression commune ou de jardin, tant que la variable de réponse (dépendante) est traitée purement numériquement. Selon votre logiciel, vous devrez peut-être pousser ou forcer que cela se produise. Avec une définition suffisamment large de la régression, pour inclure la régression logistique ou ordinale, ce n'est pas seulement possible, c'est monnaie courante.
Nick Cox

Réponses:

31

Nous devons être clairs sur nos conditions ici, mais en général, oui :

  • Si votre variable dépendante est continue (et que les résidus sont normalement distribués - voir ici ), mais que toutes vos variables indépendantes sont catégoriques, il s'agit simplement d'une ANOVA .
  • Si votre variable dépendante est catégorique et vos variables indépendantes sont continues, ce serait une régression logistique (éventuellement binaire, ordinale ou multinomiale , selon).
  • Si à la fois votre variable dépendante et vos variables indépendantes sont des variables catégorielles, vous pouvez toujours utiliser la régression logistique - c'est une sorte de version ANOVA de LR.

Notez que la régression logistique et la régression des moindres carrés ordinaires (linéaire) sont des cas particuliers du modèle linéaire généralisé .

gung - Réintégrer Monica
la source
C'est le troisième cas que vous avez mentionné, j'ai essayé LR, aucun des coefficients n'a été jugé significatif. Je pensais que je faisais quelque chose de mal.
altruiste
2
Je ne pense pas que l'ANOVA nécessite une variable dépendante continue pas plus qu'elle ne nécessite de résidus normalement distribués. Ce ne sont que des conditions dans lesquelles l'ANOVA devrait bien fonctionner.
Nick Cox
1
@NickCox, vous avez bien sûr raison; nous nous questionnons sur la façon dont nous définissons et appliquons ces termes. Je dirais que le modèle est dérivé de ces hypothèses, mais l'ANOVA peut être utilisée même si elles ne sont pas respectées, avec la question de savoir si les résultats seront utiles en fonction.
gung - Réintégrer Monica
1
@altruist, j'ai présenté les trois cas dans un souci de clarté conceptuelle; Je reconnais que le dernier est ce que tu veux. Notez que le fait que vous utilisiez ou non le logiciel correctement pour s'adapter au modèle et que vos coefficients soient ou non `` significatifs '' n'est pas lié au fait que LR soit ou non le modèle approprié à votre situation.
gung - Réintégrer Monica
4
Notez qu'être catégorique est parfois une question de définition pour le logiciel, et parfois dans l'esprit du spectateur. Quel est le nombre d'enfants, par exemple?
Nick Cox