J'ai fait face à une distribution limite avec une covariance nulle entre deux variables mais leur corrélation est . Existe-t-il une telle distribution? Comment cela s'explique-t-il?
Vous avez raison puis-je avoir besoin de donner plus de détails. OK, X et Y sont des distributions normales bivariées avec des variances et des moyennes différentes (sans n) mais corr = 1- (1 / n), étudions maintenant la distribution limite de Yn | Xn = x.
Réponses:
Suite à une clarification du PO, il apparaît que a) nous supposons que les deux variables suivent conjointement une normale bivariée et b) notre intérêt est dans la distribution conditionnelle, qui est alors
Ensuite, nous voyons quen→∞ , on a ρn→1 et la variance de la distribution conditionnelle passe à zéro. Intuitivement, si la corrélation va à l'unité, "sachantx "suffit de" savoir y " aussi.
Mais nulle part dans ce qui précède, nous obtenons queCov(Yn,Xn) est zéro. Même à la limite, la covariance restera égale àCov(Yn,Xn)→σyσx .
Notez que la covariance conditionnelle (puis aussi la corrélation conditionnelle) est toujours nulle, car,
Cela se produit car en examinantXn=x nous avons transformé l'une des variables aléatoires en constante, et les constantes ne co-varient avec rien.
la source
Étant donné que la covariance dépend de l'échelle deX et Y et la corrélation ne fait pas (redimensionnée à
[−1,−1] ) c'est possible. Par exemple, si la variance diminue vers zéro:
SiX=Y et σ2x est la variance de X , puis limσ2x→0cov(X,Y)=0 et .limσ2x→0cor(X,Y)=1
Note 1: quand la corrélation est strictement indéfinie car son dénominateur serait égal à 0.σ2x=0
la source
Pour autant que je puisse voir (peut-être en dehors de certaines circonstances spéciales, mais vous n'en mentionnez aucune), ce n'est pas possible.
La corrélation est la covariance divisée par le produit des deux écarts-types, donc si la covariance est nulle, la corrélation est soit nulle (lorsque les deux écarts-types sont non nuls) ou indéfinie (quand au moins un écart-type est égal à 0). Il ne doit pas être 1 lorsque la covariance est 0.
J'espère que vous avez soit commis une erreur dans votre analyse, soit que votre description n'est pas suffisamment claire pour discerner correctement la situation.
la source
Vous rencontrez probablement des difficultés car vous visualisez les données comme étant gaussiennes.
Il est possible que toutes les données représentent le même point (bien qu'il soit redondant) et que vous ayez deux variables avec des noms différents (alias l'un de l'autre) comprenant les données. Cela conduirait à une covariance nulle et à une corrélation de 1 car, fondamentalement, la covariance représente la répartition des données dans l'espace des fonctionnalités, tandis que la corrélation représente à quel point une variable dépend d'une autre, ou le degré d'influence qu'elles ont l'une sur l'autre. Si les données ne sont pas du tout réparties, la covariance doit être nulle.
REMARQUE Cependant, la meilleure chose que vous puissiez faire avec un tel ensemble de données est simplement de prédire tous les points comme ayant la même sortie, ce qui va très probablement donner un biais élevé
la source