Dans quelles circonstances voudriez-vous ou ne voudriez-vous pas mettre à l'échelle ou normaliser une variable avant l'ajustement du modèle? Et quels sont les avantages / inconvénients de la mise à l'échelle d'une variable?
57
Dans quelles circonstances voudriez-vous ou ne voudriez-vous pas mettre à l'échelle ou normaliser une variable avant l'ajustement du modèle? Et quels sont les avantages / inconvénients de la mise à l'échelle d'une variable?
Réponses:
La normalisation concerne tout le poids des différentes variables du modèle. Si vous effectuez la normalisation "uniquement" dans un souci de stabilité numérique, il se peut que des transformations produisent des propriétés numériques très similaires, mais une signification physique différente qui pourrait être beaucoup plus appropriée pour l'interprétation. Il en va de même pour le centrage, qui fait généralement partie de la normalisation.
Situations dans lesquelles vous souhaitez probablement normaliser:
Situations dans lesquelles vous ne souhaitez peut-être pas normaliser:
Vous pouvez faire quelque chose "entre les deux" et transformer les variables ou choisir l'unité pour que les nouvelles variables aient encore une signification physique, mais la variation de la valeur numérique n'est pas très différente, par exemple
Similaire pour le centrage:
la source
Une chose que je me demande toujours avant de normaliser est: "Comment vais-je interpréter le résultat?" S'il existe un moyen d'analyser des données sans transformation, cela peut être préférable du seul point de vue de l'interprétation.
la source
En général, je ne recommande pas la mise à l'échelle ou la normalisation à moins que ce ne soit absolument nécessaire. L'avantage ou l'intérêt d'un tel processus est que, lorsqu'une variable explicative a une dimension physique et une ampleur totalement différentes de la variable de réponse, la graduation par division par écart-type peut aider en termes de stabilité numérique et permet de comparer les effets sur plusieurs variables explicatives. Avec la standardisation la plus courante, l’effet de variable est la quantité de changement dans la variable de réponse lorsque la variable explicative augmente d’un écart-type; il indique également que la signification de l'effet de variable (la quantité de changement dans la variable de réponse lorsque la variable explicative augmente d'une unité) serait perdue bien que la valeur statistique de la variable explicative reste inchangée. cependant, Lorsqu'on considère une interaction dans un modèle, la mise à l'échelle peut être très problématique, même pour les tests statistiques, en raison d'une complication impliquant un ajustement stochastique de la mise à l'échelle dans le calcul de l'erreur standard de l'effet d'interaction (Preacher, 2003). Pour cette raison, la mise à l'échelle par écart type (ou normalisation / normalisation) n'est généralement pas recommandée, en particulier lorsque des interactions sont impliquées.
Preacher, KJ, Curran, PJ et Bauer, DJ, 2006. Outils de calcul permettant de sonder les effets d'interaction dans la régression linéaire multiple, la modélisation à plusieurs niveaux et l'analyse de courbes latentes. Journal of Educational and Behavioral Statistics, 31 (4), 437-448.
la source