Veuillez prouver que si nous avons deux variables (taille d'échantillon égale) et et que la variance dans est plus grande que dans , alors la somme des différences au carré (c'est-à-dire les distances euclidiennes au carré) entre les points de données dans est également supérieure à que , dans .YYY
20
Réponses:
Juste pour apporter une réponse "officielle", pour compléter les solutions esquissées dans les commentaires, remarquez
Aucun de , , , ou sont modifiés en déplaçant tous les uniformément vers pour une constante ou en déplaçant tous les vers pour une constante . Ainsi, nous pouvons supposer que de tels décalages ont été effectués pour rendre , d'où et .Var ( ( Y i ) )Var( ( Xje) ) Var( ( Yje) ) ∑ i , j ( Y i - Y j ) 2 X i X i - μ μ Y i Y i - ν ν ∑ X i = ∑ Y i = 0∑i , j( Xje- Xj)2 ∑i , j( Oje- Ouij)2 Xje Xje- μ μ Ouije Ouije- ν ν ∑ Xje= ∑ Yje= 0 Var ( ( Y i ) ) = ∑ Y 2 iVar( ( Xje) ) = ∑ X2je Var( ( Yje) ) = ∑ Y2je
Après avoir effacé les facteurs communs de chaque côté et en utilisant (1), la question demande de montrer que implique . ∑ i , j ( X i - X j ) 2 ≥ ∑ i , j ( Y i - Y j ) 2∑ X2je≥ ∑ Y2je ∑i , j( Xje- Xj)2≥ ∑i , j( Oje- Ouij)2
Une simple expansion des carrés et un réarrangement des sommes donnent avec un résultat similaire pour le s.
La preuve est immédiate.
la source