Différence de moyennes vs différence moyenne

11

Lorsqu'on étudie deux moyennes d'échantillons indépendants, on nous dit que nous examinons la "différence de deux moyennes". Cela signifie que nous prenons la moyenne de la population 1 ( ) et que nous lui soustrayons la moyenne de la population 2 ( ˉ y 2 ). Donc, notre «différence de deux moyennes» est ( ˉ y 1 - ˉ y 2 ).y¯1y¯2y¯1y¯2

Lors de l'étude des moyennes d'échantillons appariés, on nous dit que nous examinons la "différence moyenne", . Ceci est calculé en prenant la différence entre chaque paire, puis en prenant la moyenne de toutes ces différences.d¯

Ma question est la suivante: obtenons-nous la même chose ( - ˉ y 2 ) par rapport à son ˉ d si nous les avons calculés à partir de deux colonnes de données, et la première fois considéré comme deux échantillons indépendants, et la deuxième fois considéré comme des données appariées ? J'ai joué avec deux colonnes de données, et il semble que les valeurs soient les mêmes! Dans ce cas, peut-on dire que les différents noms sont utilisés uniquement pour des raisons non quantitatives?y¯1y¯2d¯

user84756
la source
2
Pensez-y de cette façon: comment calculeriez-vous avec des données non appariées? d¯
shadowtalker
3
@ssdecontrol Surtout si les tailles d'échantillon sont différentes.
Alexis

Réponses:

12

(Je suppose que vous voulez dire "échantillon" et non "population" dans votre premier paragraphe.)

{x1,,xn}{y1,,yn}

x¯=1ni=1nxiy¯=1ni=1nyid¯=1ni=1nxiyi

x¯y¯=(1ni=1nxi)(1ni=1nyi)=1n(i=1nxii=1nyi)=1n((x1++xn)(y1++yn))=1n(x1++xny1yn)=1n(x1y1++xnyn)=1n((x1y1)++(xnyn))=1ni=1nxiyi=d¯.
shadowtalker
la source
1
A=[1,2,3,4,5,...]B=[...,5,4,3,2,1]AAAB(qui n'est pas entièrement nul); la différence des moyens n'est pas affectée par l'ordre des éléments.
bers
Impossible de modifier mon message précédent plus longtemps. La 3ème phrase devrait commencer "Une séquence de 'différences moyennes' appariées ..."
bers
AA
C=AACABACAB
@bers Je pense que vous êtes confus, mais je suis confus quant à ce que vous êtes confus.
shadowtalker
0

la distribution de la différence moyenne devrait être plus serrée que la distribution de la différence des moyennes. Voir ceci avec un exemple simple: moyenne dans l'échantillon 1: 1 10 100 1000 moyenne dans l'échantillon 2: 2 11 102 1000 la différence de moyenne est 1 1 2 0 (contrairement aux échantillons lui-même) a une petite std.

Vlad
la source