Comprendre cela

8

Je viens de voir cette question et la merveilleuse réponse acceptée dans ce forum. J'ai ensuite été incité à essayer de comprendre intuitivement pourquoi la division deSxSy normalise la covariance:

COV(X,Y)SxSy[1,1]

Je pense que ce sera utile si je comprends juste pourquoi SxSx normaliser COV(X,X) être 1. Bien sûr, je comprends que, par définition, ils sont égaux. Mais ma question est essentiellement la suivante: en utilisant la terminologie de la réponse acceptée, pourquoi la somme totale de rouge dans l'intrigue est-elle exactementSxSx=VAR(X) (pour autant que je sache, plus précis est de dire la somme des rectangles divisés par n2 devrait être VAR(X)). Je veux dire, si nous prenons un échantillon de10 observations, que nous avons 45 rectangles, tout en utilisant la définition, nous devons trouver la moyenne de seulement 10 valeurs.

d_e
la source

Réponses:

8

Cet article présente une puissante méthode de raisonnement qui évite beaucoup d'algèbre et de calcul. Pour ceux qui connaissent cette méthode, le travail est si automatique et naturel que la réponse initiale à une question comme celle-ci est "c'est évident!" Mais ce n'est peut-être pas si évident avant d'avoir vu la méthode. Par conséquent, tous les détails sont expliqués, étape par étape.

Contexte

Il existe plusieurs formules pour la variance des données x=x1,x2,,xn (avec moyenne x¯=(x1++xn)/n), comprenant

(1)Var(x)=1ni=1n(xix¯)2=1n(i=1nxi2)x¯2.

Cela détermine la covariance des données appariées (x1,y1),,(xn,yn) via

Cov(x,y)=14(Var(x+y)Var(xy)).

La formule impliquée dans le poste de covariance-avec-crayons référencé est

(2)C(x,y)=i=1n1j=i+1n(xjxi)(yjyi)=12i,j=1n(xjxi)(yjyi).

Ce poste affirme Cest proportionnelle à la covariance. La constante de proportionnalitéc(n) pourrait (et varie) selon n. Ainsi, lorsquex=y une implication de cette affirmation est que

C(x,x)=c(n)Var(x).

Une analyse

Bien que cela puisse être démontré avec l'algèbre de force brute, il existe un meilleur moyen: exploitons les propriétés fondamentales de la covariance. Quelles propriétés seraient-elles? Je voudrais suggérer que les éléments suivants sont basiques:

  1. Indépendance de l'emplacement. C'est,

    Cov(x,y)=Cov(xa,y)
    pour n'importe quel nombre a. (L'expressionxa fait référence à l'ensemble de données x1a,x2a,,xna.)
  2. Multilinéarité. Cela implique

    Cov(λx,y)=λCov(x,y)
    pour n'importe quel nombre λ. (L'expressionλx fait référence à l'ensemble de données λx1,λx2,,λxn.)
  3. Symétrie. La covariance dex et y est la covariance de y et x:

    Cov(x,y)=Cov(y,x).
  4. Invariance sous permutations. La covariance ne change pas lorsque nous réindexons le(xi,yi). Officiellement,

    Cov(x,y)=Cov(xσ,yσ)
    pour toute permutation σSn. (Des expressions commexσ représenter la réorganisation du xi selon σ, pour que xσ=xσ(1),xσ(2),,xσ(n).)

Toutes ces propriétés valent évidemment pour les deuxVar et C d'inspecter les formes d'expressions (1) et (2). Le seul qui pourrait avoir besoin d'explication est l'indépendance de l'emplacement. Cependant, un décalage constant des valeursxi ne modifie ni les résidus ni les différences:

xix¯=(xia)xa¯

et

xjxi=(xja)(xia).

Par conséquent, il est en effet évident que la première version de (1) et (2) sont indépendants de l'emplacement.


Solution

Voici donc le raisonnement. Parce queCest symétrique et multilinéaire, c'est une forme quadratique complètement déterminée par des coefficientscij=cji:

C(x,y)=i,j=1ncijxiyj.

Parce qu'il est invariant par permutation, cij=cij pour tous les indices i,j,i,j Pour qui ij et ij; aussi,cii=cii pour tous les indices i et i. Donc,Cest déterminé par seulement deux nombres, disonsc11 et c12. Enfin, l'un de ces nombres détermine les deux autres grâce à l'invariance de localisation: cette condition signifie

0=C(0,0)=location-invarianceC(1,0)=symmetryC(0,1)=location-invarianceC(1,1)

(où "0" et "1"se réfèrent à constante n-vecteurs avec ces valeurs). Mais

0=C(1,1)=i,jncij=nc11+(n2n)c12,
déterminer chacun c11 et c12 en termes de l'autre.

Cela prouve déjà le point principal: C doit être proportionnelle à Cov, puisque chacun est déterminé par l'un quelconque de leurs coefficients. Pour trouver la constante de proportionnalité, inspectez les deux formules(1) et (2), à la recherche de toutes les apparitions de x12: vous pouvez lire la valeur associée de c11d'eux. De la deuxième version de(1), le coefficient de x12 est clairement 1/n(1/n)2. Depuis la première version de(2), avec y=x, le coefficient de x12 est clairement n1. (Géométriquement, chaque point du nuage de points de(x,x) est associé à n1 d'autres, d'où le carré de ses coordonnées apparaîtra n1 fois.) Par conséquent

c(n)=n11/n(1/n)2=n2,

QED . Ce fut le seul calcul requis pour démontrer

Cov(x,y)=1n2C(x,y)=1n2i=1n1j=i+1n(xjxi)(yjyi).
whuber
la source