Supposons que nous ayons affaire à cet ensemble de données où est une variable continue (par exemple, exponentielle) et est une distribution discrète (par exemple Poisson) pour . Disons que est la corrélation entre et . Comment peut-on définir?
correlation
count-data
user9292
la source
la source
Réponses:
Je dirais qu'il y a au moins 3 options décentes qui auraient du sens pour vous:
Pour répondre plus directement à votre question, calculezρ comme d'habitude (en supposant que vous entendez par là le coefficient de corrélation produit-moment) aurait probablement les propriétés que vous attendez, ou du moins il augmenterait à mesure que la dépendance linéaire entre les variables augmente. Cependant, un test statistique de l'importance de la corrélation ne serait pas valide car l'une des hypothèses requises pour un tel test est la normalité bivariée et ce n'est clairement pas vrai si l'une des variables est discrète.
Des tests de signification avec un coefficient de corrélation non paramétrique (par exemple celui de Spearman) seraient cependant possibles et il serait facile de trouver des implémentations bien documentées de cela dans n'importe quelle langue.
la source