Je veux comparer des données qui se répartissent entre trois groupes différents, par exemple:
ID Group Prop.Nitrogen
1 A 0.89
2 A 0.85
3 B 0.92
4 B 0.97
Après Wharton et Hui (doi: 10.1890 / 10-0340.1 1 ) je pensais que je verrais si ces données seraient mieux traitées en utilisant un logit transformé.
Lorsque je regarde des graphiques de diagnostic pour des modèles linéaires sur les données transformées et non transformées, ils se ressemblent beaucoup sans problèmes évidents, et il n'y a que de petites différences dans les paramètres estimés. Cependant, j'aimerais toujours pouvoir dire quelque chose sur la façon dont le modèle s'adapte aux versions transformées et non transformées des données - je sais que je ne peux pas comparer directement les valeurs AIC. Y a-t-il une correction et je peux faire pour l'examiner? Ou devrais-je adopter une approche différente?
la source
boxcox()
dans la bibliothèque MASS), bien que je ne sois pas sûr qu'elle puisse traiter les transformations logit.boxcox()
sur les données brutes, ou sur les données transformées?Réponses:
Mon expérience avec les données transformées suggère que la corrélation s'améliore après la transformation ainsi que l'homoscédasticité et / ou la normalité, bien qu'elles ne soient pas nécessairement toutes optimales pour une seule transformation. Une réponse simple peut être de calculer les coefficients de corrélation entre les deux modèles et leurs ensembles de données respectifs. On peut même tester la signification de la différence des coefficients de corrélation corrélés. Les tests d'homoscédasticité et de type de fonction de densité des résidus peuvent également offrir un moyen de les évaluer.
la source