Dans un certain nombre de progiciels statistiques, y compris SAS, SPSS et peut-être plus, il existe une option pour "supprimer l'interception". Pourquoi voudriez-vous faire ça?
regression
user333
la source
la source
Prenons le cas d'une covariable catégorielle à 3 niveaux. Si l'on a une interception, cela nécessiterait 2 variables indicatrices. En utilisant le codage habituel pour les variables indicatrices, le coefficient de l'une ou l'autre variable indicatrice est la différence moyenne par rapport au groupe de référence. En supprimant l'ordonnée à l'origine, vous auriez 3 variables représentant la covariable catégorielle, au lieu de seulement 2. Un coefficient est alors l'estimation moyenne pour ce groupe. Un exemple plus concret de ce qu'il faut faire est en science politique où l'on peut étudier les 50 États des États-Unis. Au lieu d'avoir une interception et 49 variables indicatrices pour les états, il est souvent préférable de supprimer l'interception et d'avoir au lieu de cela 50 variables.
la source
Pour illustrer le point de @Nick Sabbe avec un exemple spécifique.
J'ai vu une fois un chercheur présenter un modèle de l'âge d'un arbre en fonction de sa largeur. On peut supposer que lorsque l'arbre est à zéro, il a effectivement une largeur de zéro. Ainsi, une interception n'est pas requise.
la source