Disons que nous avons les statistiques ci-dessous
gender mean sd n
f 1.666667 0.5773503 3
m 4.500000 0.5773503 4
Comment effectuez-vous un test t à deux échantillons (pour voir s'il y a une différence significative entre les moyennes des hommes et des femmes dans certaines variables) en utilisant des statistiques comme celle-ci plutôt que des données réelles?
Je n'ai trouvé nulle part sur Internet comment procéder. La plupart des didacticiels et même le manuel traitent du test avec l'ensemble de données réel uniquement.
?pt
) - voir en particulierpt()
- ont toutes les informations dont vous auriez besoin pour le faire vous-même. Et vous en apprendrez beaucoup sur les statistiques et R si vous faites cela.tsum.test
fonction du package BSDA , qui implémente un test t (deux échantillons; Welch ou à variance égale et également un échantillon) à partir des données récapitulatives que vous fournissez. Cela fonctionne essentiellement comme le test t dans vanilla R mais sur les informations de résumé.tsum.test()
de l'BSDA library
comme indiqué par Cox @ Nick. Cela fait exactement la même chose que ce que @macro a écrit en lignes de code. Si la question posée, quelle est la compréhension du calcul de fond pour calculer la statistique du test t dans R, alors Marco serait une réponse plus appropriée. Veuillez noter que je n'essaie pas d'offenser qui que ce soit, mais simplement d'exprimer mon opinion personnelle liée à mes antécédents professionnels. Et @marco c'est du codage soigné :)Réponses:
Vous pouvez écrire votre propre fonction sur la base de ce que nous savons sur la mécanique du test deux échantillonst . Par exemple, cela fera le travail:
la source
t.test
été rejeté, alors voici un code pour confirmer:(tt2 <- t.test2(mean(x1), mean(x2), sd(x1), sd(x2), length(x1), length(x2))); (tt <- t.test(x1, x2)); tt$statistic == tt2[["t"]]; tt$p.value == tt2[["p-value"]]
La différence attendue est probablement nulle.
Si vous voulez la valeur p, utilisez simplement la
pt()
fonction:Ainsi, assembler le code:
Cela suppose des variances égales, ce qui est évident car ils ont le même écart-type.
la source
R
Vous pouvez effectuer les calculs en fonction de la formule dans le livre (sur la page Web), ou vous pouvez générer des données aléatoires qui ont les propriétés indiquées (voir la
mvrnorm
fonction dans leMASS
package) et utiliser lat.test
fonction régulière sur les données simulées.la source
mvrnorm
fonction dans leMASS
package (vous devez définir l'argument empirique sur TRUE).La question concerne R, mais le problème peut survenir avec tout autre logiciel statistique. Stata, par exemple, dispose de diverses commandes dites immédiates, qui permettent des calculs à partir des seules statistiques récapitulatives. Voir http://www.stata.com/manuals13/rttest.pdf pour le cas particulier de la
ttesti
commande, qui s'applique ici.la source