Existe-t-il un principe général permettant de calculer la corrélation de Pearson pour deux variables aléatoires X et Y avant de prendre leur transformation logarithmique ou après? Existe-t-il une procédure de test qui est plus appropriée? Ils donnent des valeurs similaires mais différentes, car la transformation logarithmique est non linéaire. Cela dépend-il si X ou Y sont plus proches de la normalité après log? Si oui, pourquoi est-ce important? Et cela signifie-t-il que l'on devrait faire un test de normalité sur X et Y par rapport à log (X) et log (Y) et en fonction de cela décider si pearson (x, y) est plus approprié que pearson (log (x), log ( y))?
regression
correlation
logarithm
pearson-r
user9097
la source
la source
Réponses:
Étant donné que et sont des transformations monotones des données et , vous pouvez également choisir d'utiliser la corrélation de rang de Spearman ( ) et ne pas vous soucier de transformer vos données, comme vous obtiendriezJournal( X) Journal( O) X Oui ρS ρS( X, Y) = ρS( journal(X) , journal(O) )
la source
La corrélation (Pearson) mesure une relation linéaire entre deux variables continues. Il n'y a pas un tel choix pour (X, Y) ou (log X, log Y). Le diagramme de dispersion des variables peut être utilisé pour comprendre la relation.
Le lien suivant peut répondre concernant le problème de normalité. lien
la source
La corrélation de Pearson est destinée aux tests paramétriques et est plus puissante que les tests non paramétriques. Ainsi, nous choisissons d'utiliser la transformation avant toute procédure non paramétrique. Transformez vos données et obtenez une corrélation pearsons. C'est ça.
la source