Supposons que j'ai 20 souris. J'appaire les souris d'une manière ou d'une autre, de sorte que j'obtienne 10 paires. Aux fins de cette question, il pourrait s'agir d'un appariement aléatoire, OU il pourrait s'agir d'un appariement sensé, comme essayer d'associer des souris de la même portée, du même sexe, avec un poids similaire, OU il pourrait s'agir d'un appariement délibérément stupide comme en essayant de jumeler des souris avec des poids aussi inégaux que possible. J'utilise ensuite des nombres aléatoires pour affecter une souris de chaque paire au groupe témoin et l'autre souris au groupe à traiter. Je fais maintenant l'expérience, en ne traitant que les souris à traiter, mais en ne prêtant aucune attention aux dispositions qui viennent d'être prises.
Lorsque l'on vient analyser les résultats, on peut utiliser soit des tests t non appariés, soit des tests t appariés. En quoi, le cas échéant, les réponses différeront-elles? (Je m'intéresse essentiellement aux différences systématiques de tout paramètre statistique qui doit être estimé.)
La raison pour laquelle je pose cette question est qu'un article auquel j'ai participé récemment a été critiqué par un biologiste pour avoir utilisé un test t apparié plutôt qu'un test t non apparié. Bien sûr, dans l'expérience réelle, la situation n'était pas aussi extrême que la situation que j'ai esquissée, et il y avait, à mon avis, de bonnes raisons pour l'appariement. Mais le biologiste n'était pas d'accord.
Il me semble qu'il n'est pas possible d'améliorer incorrectement la signification statistique (diminution de la valeur de p), dans les circonstances que j'ai esquissées, en utilisant un test t apparié, plutôt qu'un test non apparié, même s'il est inapproprié de l'appairer. Cela pourrait cependant aggraver la signification statistique si les souris étaient mal appariées. Est-ce correct?
la source
Plutôt que d'appairer, il vaut probablement mieux comprendre le modèle de données sous-jacent. Si l'appariement est effectué pour faire face à une hétérogénéité incontrôlée, il est généralement le cas (sauf dans les études jumelles) que l'appariement ne contrôle que partiellement cette source de variabilité et qu'une régression multiple ferait mieux. En effet, l'appariement sur des variables continues entraîne fréquemment une variabilité résiduelle en raison de l'impossibilité d'effectuer l'appariement exact sur ces variables.
la source
Les deux tests (appariés et non appariés) posent des questions différentes afin d'obtenir des réponses différentes. Un appariement correct est presque toujours plus puissant que non apparié - c'est vraiment le but de l'appariement. Donc, puisque vous dites que l'appariement est correct, il est probable que la valeur de p pour votre test apparié soit inférieure à celle des mêmes données non appariées. Vous pouvez, bien sûr, faire les deux et voir par vous-même.
Par conséquent, la réponse à votre dilemme est substantielle et non statistique. Votre jumelage est-il correct?
Pourriez-vous obtenir un résultat plus significatif d'un appariement aléatoire que d'un test non apparié? Voyons voir:
Oui vous pouvez, bien qu'ici la différence soit très petite, le couple avait un p plus faible. J'ai exécuté ce code plusieurs fois. Sans surprise, parfois un p est plus faible, parfois l'autre, mais la différence était faible dans tous les cas. Cependant, je suis sûr que dans certaines situations, la différence dans les valeurs de p pourrait être grande.
la source
Je comprends maintenant beaucoup mieux ce qui m'inquiétait au sujet des tests t appariés par rapport aux tests t non appariés et des valeurs p associées. Découvrir a été un voyage intéressant et il y a eu beaucoup de surprises en cours de route. Une surprise a résulté d'une enquête sur la contribution de Michael. C'est irréprochable en termes de conseils pratiques. De plus, il dit ce que je pense que presque tous les statisticiens croient, et il a plusieurs votes positifs pour le confirmer. Cependant, en tant que morceau de théorie, ce n'est pas littéralement correct. J'ai découvert cela en élaborant les formules des valeurs de p, puis en réfléchissant soigneusement à la façon d'utiliser les formules pour aboutir à des contre-exemples. Je suis mathématicien de formation, et le contre-exemple est un "contre-exemple de mathématicien". Ce n'est pas quelque chose que vous rencontrerez dans les statistiques pratiques, le genre de chose que j'essayais de découvrir quand j'ai posé ma question d'origine.
Voici le code R qui donne le contre-exemple:
Notez les caractéristiques suivantes: X et Y sont deux 10-tuples dont la différence est énorme et presque constante. Pour de nombreux chiffres significatifs, la corrélation est de 1.000 ... La valeur de p pour le test non apparié est environ 10 ^ 40 fois plus petite que la valeur de p pour le test apparié. Cela contredit donc le récit de Michael, à condition de lire son récit littéralement, à la manière d'un mathématicien. Ici se termine la partie de ma réponse liée à la réponse de Michael.
Voici les réflexions suscitées par la réponse de Peter. Au cours de la discussion de ma question initiale, j'ai supposé dans un commentaire que deux distributions particulières de valeurs de p qui sonnent différemment sont en fait les mêmes. Je peux maintenant le prouver. Ce qui est plus important, c'est que la preuve révèle la nature fondamentale d'une valeur de p, si fondamentale qu'aucun texte (que j'ai rencontré) ne dérange à expliquer. Peut-être que tous les statisticiens professionnels connaissent le secret, mais pour moi, la définition de la valeur p m'a toujours semblé étrange et artificielle. Avant de révéler le secret du statisticien, permettez-moi de préciser la question.
la source
J'offrirais une autre perspective. Souvent, l'appariement est fait pour réduire le biais. Supposons que vous souhaitez savoir si l'exposition E est un facteur de risque pour un résultat continu Y. Pour chaque sujet E +, vous obtenez un sujet correspondant à l'âge et au sexe qui est E-. Maintenant, nous pourrions faire soit un test t apparié, soit un test t non apparié. Je pense que nous devrions tenir compte de l'appariement de manière explicite et effectuer un test t par paires. Elle est plus basée sur des principes car elle prend en compte le design. La prise en compte de l'appariement dans l'analyse est une question de compromis biais-variance. La prise en compte de l'appariement dans l'analyse offre une meilleure protection contre les biais, mais peut augmenter la variance. Faire un test t non apparié peut être plus efficace, mais il ne fournirait aucune protection contre les biais.
la source