Je recherche des conseils et des commentaires qui traitent de l'analyse des ratios et des taux. Dans le domaine dans lequel je travaille l'analyse des ratios en particulier est très répandue mais j'ai lu quelques articles qui suggèrent que cela peut être problématique, je pense à:
Kronmal, Richard A. 1993. Corrélation fallacieuse et erreur de la norme de rapport revisitée. Journal de la Royal Statistical Society Series A 156 (3): 379-392
et documents connexes. D'après ce que j'ai lu jusqu'à présent, il semble que les ratios peuvent générer de fausses corrélations, forcer des lignes de régression à travers l'origine (ce qui n'est pas toujours approprié) et les modéliser peut violer le principe de marginalité s'il n'est pas fait correctement ( Utilisation des ratios dans la régression , par Richard Goldstein ). Cependant, il doit y avoir des occasions où l'utilisation de ratios est justifiée et je voulais avoir des opinions de statisticiens sur ce sujet.
Réponses:
Je ne qualifierais pas les corrélations observées de fausses, mais plutôt de fausses inférences causales tirées de ces corrélations. Les problèmes de ratios sont du même type que d'autres types de confusion.
Si vous définissez des variables aléatoiresU=XQ &V=YQ X Y Q U V X Y Q U V Q X=U1/Q Y=V1/Q Q Q R,S,T,…
Aldrich (1995), "" Corrélations authentiques et parasites chez Pearson et Yule ", Statistical Science , 10 , 4 fournit une perspective historique intéressante.
† Voir Inclure l'interaction mais pas les principaux effets dans un modèle .
la source