Lien entre la variance et les distances par paires au sein d'une variable

20

Veuillez prouver que si nous avons deux variables (taille d'échantillon égale) et et que la variance dans est plus grande que dans , alors la somme des différences au carré (c'est-à-dire les distances euclidiennes au carré) entre les points de données dans est également supérieure à que , dans .YXOuiYXOuiYXOui

ttnphns
la source
1
Veuillez préciser: Lorsque vous parlez de variance , voulez-vous dire la variance de l'échantillon ? Quand vous dites la somme des différences au carré , voulez-vous dire ? je,j(Xje-Xj)2
cardinal
9
En supposant ce qui précède: en tenant soigneusement compte des éléments dans le terme croisé. J'imagine que vous pouvez combler les (petites lacunes). Le résultat suit alors trivialement.
je,j(Xje-Xj)2=jej((Xje-X¯)-(Xj-X¯))2=2nje=1n(Xje-X¯)2,
cardinal
2
Il existe également un moyen de le faire "sans" aucun calcul en considérant le fait que si et sont iid de (avec une variance bien définie), alors . Cela nécessite cependant une compréhension un peu plus ferme des concepts de probabilité. X 2 F E ( X 1 - X 2 ) 2 =X1X2FE(X1-X2)2=2Vuner(X1)
cardinal
1
Pour une question connexe, j'ai utilisé une visualisation de ce qui se passe ici dans une réponse sur stats.stackexchange.com/a/18200 : les différences au carré sont des zones de carrés.
whuber
1
@whuber: Très bien. D'une manière ou d'une autre, j'avais raté cette réponse en cours de route.
Cardinal

Réponses:

5

Juste pour apporter une réponse "officielle", pour compléter les solutions esquissées dans les commentaires, remarquez

  1. Aucun de , , , ou sont modifiés en déplaçant tous les uniformément vers pour une constante ou en déplaçant tous les vers pour une constante . Ainsi, nous pouvons supposer que de tels décalages ont été effectués pour rendre , d'où et .Var ( ( Y i ) )Var((Xje))Var((Ouije))i , j ( Y i - Y j ) 2 X i X i - μ μ Y i Y i - ν ν X i = Y i = 0je,j(Xje-Xj)2je,j(Ouije-Ouij)2XjeXje-μμOuijeOuije-ννXje=Ouije=0 Var ( ( Y i ) ) = Y 2 iVar((Xje))=Xje2Var((Ouije))=Ouije2

  2. Après avoir effacé les facteurs communs de chaque côté et en utilisant (1), la question demande de montrer que implique .i , j ( X i - X j ) 2i , j ( Y i - Y j ) 2Xje2Ouije2je,j(Xje-Xj)2je,j(Ouije-Ouij)2

  3. Une simple expansion des carrés et un réarrangement des sommes donnent avec un résultat similaire pour le s.

    je,j(Xje-Xj)2=2Xje2-2(Xje)(Xj)=2Xje2=2Var((Xje))
    Oui

La preuve est immédiate.

whuber
la source