Lorsqu'on étudie deux moyennes d'échantillons indépendants, on nous dit que nous examinons la "différence de deux moyennes". Cela signifie que nous prenons la moyenne de la population 1 ( ) et que nous lui soustrayons la moyenne de la population 2 ( ˉ y 2 ). Donc, notre «différence de deux moyennes» est ( ˉ y 1 - ˉ y 2 ).
Lors de l'étude des moyennes d'échantillons appariés, on nous dit que nous examinons la "différence moyenne", . Ceci est calculé en prenant la différence entre chaque paire, puis en prenant la moyenne de toutes ces différences.
Ma question est la suivante: obtenons-nous la même chose ( - ˉ y 2 ) par rapport à son ˉ d si nous les avons calculés à partir de deux colonnes de données, et la première fois considéré comme deux échantillons indépendants, et la deuxième fois considéré comme des données appariées ? J'ai joué avec deux colonnes de données, et il semble que les valeurs soient les mêmes! Dans ce cas, peut-on dire que les différents noms sont utilisés uniquement pour des raisons non quantitatives?
la source
Réponses:
(Je suppose que vous voulez dire "échantillon" et non "population" dans votre premier paragraphe.)
la source
la distribution de la différence moyenne devrait être plus serrée que la distribution de la différence des moyennes. Voir ceci avec un exemple simple: moyenne dans l'échantillon 1: 1 10 100 1000 moyenne dans l'échantillon 2: 2 11 102 1000 la différence de moyenne est 1 1 2 0 (contrairement aux échantillons lui-même) a une petite std.
la source