Juste une sémantique et pour être clair:
- variable dépendante == résultat == " y " dans les formules de régression telles que
y=β0+β1x1+β2x2+...+βkxk
- variable indépendante == prédicteur == un de " Xk " dans les formules de régression telles que y= β0+ β1X1+ β2X2+ . . . + βkXk
Ainsi, dans la plupart des situations, le type de régression dépend du type de variable dépendante, de résultat ou de " y " . Par exemple, la régression linéaire est utilisée lorsque la variable dépendante est continue, la régression logistique lorsque la personne à charge est catégorielle avec 2 catégories et la régression multinomique (n) al lorsque la personne à charge est catégorielle avec plus de 2 catégories. Les prédicteurs peuvent être n'importe quoi (nominal ou ordinal catégorique, ou continu, ou un mélange) .
(La remarque ci-dessous peut être redondante pour vous, mais je l'ajoute quand même)
Cependant, notez que la plupart des logiciels vous obligent à recoder les prédicteurs catégoriels dans un système numérique binaire . Cela signifie simplement coder le sexe à 0 pour les femmes et 1 pour les hommes ou vice versa. Pour les variables catégorielles avec plus de 2 niveaux, vous devrez les recoder en variables factices où est le nombre de niveaux et ces variables factices contiennent un 0 ou 1 lorsqu'elles sont dans la catégorie correspondante. De cette façon, chaque individu (échantillon) devrait être représenté en ayant un 1 pour la variable muette dont il fait partie et un 0 pour les autres, ou un 0 pour tous les nuls quand il fait partie du groupe de référence.LL - 1L