Si je comprends bien, nous pouvons obtenir la corrélation en normalisant la covariance en utilisant l'équation
où est l'écart-type de . Xi
Ma préoccupation est que si l'écart-type est égal à zéro? Y a-t-il une condition qui garantit qu'il ne peut pas être nul?
Merci.
correlation
standard-deviation
covariance
chepukha
la source
la source
Réponses:
Il est vrai que, si l'un de vos SD est égal à 0, cette équation n'est pas définie. Cependant, une meilleure façon de penser à cela est que si l'un de vos SD est 0, il n'y a pas de corrélation. En termes conceptuels lâches, une corrélation vous indique comment une variable se déplace pendant que l'autre variable se déplace. Un écart-type de 0 implique que la variable ne «se déplace pas». Il faudrait avoir un vecteur d'une constante, comme
rep(constant, n_times)
.la source
L'autre chose à considérer est les hypothèses sous-jacentes lorsque nous parlons de moyennes et d'écarts-types, et de corrélations.
Si nous parlons d'un échantillon de données, une hypothèse courante est que les données sont (au moins approximativement) normalement distribuées, ou peuvent être transformées telles qu'elles sont (par exemple via une transformation logarithmique). Si vous observez un écart-type de zéro, il y a deux scénarios: soit l'écart-type est en fait non nul, mais très petit, et donc l'ensemble de données que vous avez a des échantillons qui sont tous sur la valeur moyenne (cela pourrait, par exemple, se produire si vous mesurez des données à un niveau de précision grossier); ou le modèle est mal spécifié.
Dans ce deuxième scénario, l'écart type, et par conséquent la corrélation, est une mesure dénuée de sens.
Plus généralement, les distributions sous-jacentes doivent toutes deux avoir des seconds moments finis, et donc des écarts-types non nuls, pour que la corrélation soit un concept valide.
la source
Une corrélation est le cosinus de l'angle entre deux vecteurs. Dire que l'écart-type de Y est nul revient à dire que le vecteur Y-moyenne (Y) est nul (ou, plus rigoureusement, qu'il représente zéro dans l'espace vectoriel approprié). La question devient donc "Que peut-on dire de l'angle (cosinus de) entre le vecteur zéro et le vecteur X-mean (X)?". Plus généralement, dans tout espace vectoriel avec un produit intérieur, que signifie l'angle entre le vecteur zéro et un autre vecteur? Il n'y a qu'une seule réponse à cela, à mon avis, et c'est que le concept d '"angle" dans cette situation n'a pas de sens, et donc le concept de corrélation dans cette situation n'a pas de sens.
la source
Avertissement, je me rends compte qu'il existe déjà une réponse de qualité acceptée, donc cela devrait être une réponse, mais je n'ai pas les points d'expérience pour le permettre. @Dilip a mentionné que vous pouvez définir la corrélation comme 0 pour la convention, mais cela semble problématique car cela aurait une interprétation très différente d'une corrélation qui est vraiment nulle (avec des SD non nuls). La question d'origine dit "si la SD d'une variable est nulle". Si nous nous arrêtons et pensons à la définition de «variable», nous obtenons un chemin beaucoup plus direct vers la réponse. Une variable avec 0 SD n'est pas du tout une variable, c'est une constante. Donc, dans ce cas, vous n'avez pas deux variables, il n'est donc pas logique du tout de définir une corrélation.
la source