«Intention de l'investigateur» et seuils / valeurs p

21

Je lis les diapositives "Faire une analyse des données bayésiennes" de John Kruschke , mais j'ai en fait une question sur son interprétation des tests t et / ou de l'ensemble du cadre de test de signification d'hypothèse nulle. Il soutient que les valeurs de p sont mal définies car elles dépendent des intentions de l'enquêteur.

En particulier, il donne un exemple (pages 3-6) de deux laboratoires qui collectent des ensembles de données identiques comparant deux traitements. Un laboratoire s'engage à collecter des données auprès de 12 sujets (6 par condition), tandis que l'autre collecte des données pour une durée fixe, ce qui donne également 12 sujets. Selon les diapositives, la valeur critique pour p < 0,05 diffère entre ces deux schémas de collecte de données: t crit = 2,33 pour le premier, mais t crit = 2,45 pour le second!tp<0,05tcrit=2,33tcrit=2,45

Un article de blog - que je ne trouve pas maintenant - a suggéré que le scénario à durée fixe a plus de degrés de liberté car ils auraient pu collecter des données sur 11, 13 ou tout autre nombre de sujets, tandis que le scénario à N fixe, par définition, a .N=12

Quelqu'un pourrait-il m'expliquer:

  • Pourquoi la valeur critique différerait-elle entre ces conditions?

  • (En supposant que c'est un problème) Comment procéder pour corriger / comparer les effets des différents critères d'arrêt?

Je sais que la définition des critères d'arrêt en fonction de la signification (par exemple, un échantillon jusqu'à ) peut augmenter les chances d'une erreur de type I, mais cela ne semble pas se produire ici, car aucune règle d'arrêt ne dépend du résultat de l'analyse.p<0,05

Matt Krause
la source

Réponses:

11

Voici quelques informations supplémentaires: http://doingbayesiandataanalysis.blogspot.com/2012/07/07sampling-distributions-of-t-when.html

Une discussion plus complète est fournie ici: http://www.indiana.edu/~kruschke/BEST/ Cet article considère les valeurs de p pour l'arrêt au seuil N, l'arrêt à la durée du seuil et l'arrêt à la valeur du seuil t.

John K. Kruschke
la source
Hou la la! Directement de la bouche du cheval, pour ainsi dire ... C'est certainement une idée intéressante qui ne m'est pas venue à l'esprit. Merci pour l'information supplémentaire.
Matt Krause
Je voulais ajouter que cela est longuement discuté dans le livre du Dr Kruschke (au chapitre 11).
Matt Krause
13

J'ai finalement retrouvé l'article associé aux diapositives: Kruschke (2010) , également disponible directement auprès de l'auteur (via CiteSeerX) ici , car la revue n'est pas largement diffusée. L'explication est un peu prosaïque, mais je ne suis toujours pas sûr de l'acheter.

Dans le cas de N fixe, la valeur critique est calculée comme suit: 2 N échantillons sont tirés au hasard dans la (même) population et une valeur t est calculée. Ce processus est répété plusieurs fois pour créer une distribution nulle. Enfin, t c r i t devrait être le 95e centile de cette distribution.t2Nttcrjet

Pour le cas à durée fixe, il suppose que les sujets arrivent à un taux moyen . La distribution nulle est construite en répétant deux étapes. Dans la première étape, le nombre de sujets pour chaque condition N 1 et N 2 est tiré d'une distribution de possessions avec le paramètre λ . Ensuite, N 1 et N 2 tirages aléatoires de la population sont utilisés pour calculer une valeur t . Cette opération est répétée plusieurs fois et t c r i t devrait être le 95e centile de cette distribution.λN1N2λN1N2ttcrjet

Cela me semble un peu ... effronté ... Si je comprends bien, il n'y a pas une seule distribution ; il s'agit plutôt d'une famille de distributions, dont la forme est en partie déterminée par le paramètre des degrés de liberté. Pour la condition N fixe , il y a N sujets par groupe et la valeur t appropriée pour un test t non apparié est celle avec 2 N - 2 degrés de liberté, ce qui est vraisemblablement ce que sa simulation reproduit. tNNt2N-2

Dans l'autre condition, il semble que la distribution de type " " soit en fait une combinaison d'échantillons provenant de nombreuses distributions de t différentes , selon les tirages spécifiques. En fixant λ = N , on pourrait obtenir des degrés de liberté moyens égaux à 2 N - N , mais ce n'est pas tout à fait suffisant. Par exemple, la moyenne des distributions t pour ν = 1 et ν = 5 ne semble pas être la distribution t avec 3 degrés de liberté.ttλ=N2N-Ntν=1ν=5t

En résumé:

  • L'auteur générait par simulation, au lieu de simplement les calculer à partir du CDF.tcrjet
  • La façon dont l'auteur a simulé le scénario à durée fixe semble pouvoir grossir la queue de la distribution correspondante .t
  • Je ne suis pas convaincu que ce soit un problème, mais je serais heureux de lire / voter / accepter les réponses si quelqu'un pense le contraire.
Matt Krause
la source
Pourquoi pouvez-vous répondre à votre propre question et lui donner une coche? Il ne semble pas que vous devriez pouvoir vous donner des pointes de rep!
Michael R. Chernick
5
Il n'y a rien de mal à répondre à sa propre question , Michael.
chl
@MichaelChernick, je crois que vous n'avez pas de représentant si vous acceptez votre propre réponse. À l'époque, cela semblait être la bonne chose à faire, car j'avais plus ou moins retrouvé la réponse dans les deux semaines qui ont suivi, mais j'ai changé mon acceptation en réponse à John K. Kruschke car il est clairement l'autorité à lui tout seul slides :-)
Matt Krause
Merci intéressant. Mais je ne vois pas pourquoi on devrait vérifier sa propre réponse à tout moment même si elle semble être correcte et la meilleure. Nous avons établi que vérifier votre propre réponse ne vous donne pas de points de représentant.
Michael R. Chernick
3
Étant donné que marquer une réponse comme acceptée n'a d'autre but que d'indiquer une solution correcte (pour les futurs visiteurs), en particulier lorsqu'aucune autre n'a été proposée, je n'y vois aucun problème. Personnellement, j'ai voté pour cette réponse il y a longtemps, car j'apprécie que le PO nous permette de bénéficier de ses propres recherches. Et je suis vraiment désolé de ne pas pouvoir donner un vote supplémentaire pour le simple fait de suivre ce fil et de mettre à jour sa décision. PS "Nous avons établi ..." fait référence à Pourquoi est-il possible de se donner des points de réputation? .
chl