Mon professeur de statistique prétend que le mot "corrélation" s'applique strictement aux relations linéaires entre les variables, tandis que le mot "association" s'applique largement à tout type de relation. En d'autres termes, il prétend que le terme "corrélation non linéaire" est un oxymore.
D'après ce que je peux faire de cette section dans l'article de Wikipedia sur " Corrélation et dépendance ", le coefficient de corrélation de Pearson décrit le degré de "linéarité" dans la relation entre deux variables. Cela suggère que le terme "corrélation" s'applique en fait exclusivement aux relations linéaires.
D'un autre côté, une recherche rapide sur Google de la " corrélation non linéaire " révèle un certain nombre d'articles publiés qui utilisent le terme.
Mon professeur a-t-il raison, ou "corrélation" est-elle simplement synonyme d '"association"?
la source
Réponses:
Non; la corrélation n'est pas équivalente à l'association. Cependant, la signification de la corrélation dépend du contexte.
La définition classique de la statistique est, pour citer l'Encyclopédie des Sciences Statistiques de Kotz et Johnson "une mesure de la force de la relation linéaire entre deux variables aléatoires". En statistique mathématique, la "corrélation" semble généralement avoir cette interprétation.
Dans les domaines appliqués où les données sont généralement ordinales plutôt que numériques (par exemple, la psychométrie et les études de marché), cette définition n'est pas aussi utile que le concept de linéarité suppose des données qui ont des propriétés d'échelle d'intervalle. Par conséquent, dans ces domaines, la corrélation est plutôt interprétée comme indiquant un modèle bivarié croissant ou décroissant monotone ou, une corrélation des rangs. Un certain nombre de statistiques de corrélation non paramétriques ont été développées spécifiquement pour cela (par exemple, la corrélation de Spearman et le tau-b de Kendall). Celles-ci sont parfois appelées "corrélations non linéaires" car ce sont des statistiques de corrélation qui ne supposent pas de linéarité.
Parmi les non-statisticiens, la corrélation signifie souvent une association (parfois avec et parfois sans connotation causale). Indépendamment de l'étymologie de la corrélation, la réalité est que parmi les non-statisticiens, elle a ce sens plus large et aucune quantité de les réprimander pour une utilisation inappropriée est susceptible de changer cela. J'ai fait un "google" et il semble que certaines utilisations de la corrélation non linéaire semblent être de ce type (en particulier, il semble que certaines personnes utilisent le terme pour désigner une relation non linéaire fluide entre les variables numériques) .
La nature dépendante du contexte du terme "corrélation non linéaire" signifie peut-être qu'il est ambigu et ne devrait pas être utilisé. En ce qui concerne la "corrélation", vous devez déterminer le contexte de la personne qui utilise le terme afin de savoir ce que cela signifie.
la source
Je ne vois pas grand intérêt à essayer de démêler les termes «corrélation» et «association». Après tout, Pearson lui-même (et d'autres) a développé une mesure de relation non linéaire qu'ils ont appelé le « rapport de corrélation ».
la source
Il semble y avoir un malentendu d'association. Les mesures d'association (ampleur de l'effet) sont inhérentes à l'analyse quantitative et non qualitative.
la source
Je dirais que la corrélation s'applique aux données quantitatives et l'association aux données qualitatives et les deux n'ont pas de relation causale obligatoire.
la source
L'idée que le poids (d'un homme) n'est pas corrélé à la taille (car la fonction correspondante est du 3ème degré, non linéaire) me semble très étrange. La corrélation linéaire doit être traitée comme un cas particulier d'association.
la source
La corrélation et l'association sont différentes. La corrélation décrit les trois types de relations positives, négatives et non corrélées. Il décrit également l'ampleur de la corrélation de 0 à 1, de -1 à 0. L'association ne révèle pas quels types d'association et combien d'association.
la source
En ce qui concerne la linéarité, la réponse de Tim et Nick Cox l'a complètement couverte. Là où je pensais pouvoir contribuer, c'est une façon claire de penser à la différence entre association et corrélation.
Association --- mesure la relation étroite entre deux variables (c.-à-d. Si elles sont dépendantes ou indépendantes).
Corrélation --- mesure de quelle manière deux variables sont liées (c.-à-d. Positives ou négatives).
En fin de compte, je dirais que vous ne pouvez jamais vous tromper en les traitant distinctement, cela aidera à l'interprétation et aux analyses à long terme. J'espère que cela t'aides.
la source