Les distributions d'échantillonnage sont-elles légitimes pour l'inférence?

15

Certains bayésiens attaquent l'inférence fréquentiste en déclarant qu '"il n'y a pas de distribution d'échantillonnage unique" car cela dépend des intentions du chercheur (Kruschke, Aguinis et Joo, 2012, p. 733).

Par exemple, disons qu'un chercheur commence la collecte de données, mais son financement a été inopinément réduit après 40 participants. Comment les distributions d'échantillonnage (et les IC et valeurs p subséquentes) seraient-elles même définies ici? Devrions-nous simplement supposer que chaque échantillon constitutif a N = 40? Ou serait-il composé d'échantillons avec un N différent, chaque taille étant déterminée par d'autres moments aléatoires, son financement aurait pu être réduit?

Les distributions nulles t, F, khi-deux (etc.) trouvées dans les manuels supposent toutes que le N est fixe et constant pour tous les échantillons constitutifs, mais cela peut ne pas être vrai dans la pratique. Avec chaque procédure d'arrêt différente (par exemple, après un certain intervalle de temps ou jusqu'à ce que mon assistant se fatigue), il semble y avoir une distribution d'échantillonnage différente, et l'utilisation de ces distributions «N éprouvées et fixes» est inappropriée.

Dans quelle mesure cette critique porte-t-elle préjudice à la légitimité des IC fréquentistes et des valeurs p? Y a-t-il des réfutations théoriques? Il semble qu'en attaquant le concept de la distribution d'échantillonnage, tout l'édifice de l'inférence fréquentiste soit ténu.

Toutes les références savantes sont grandement appréciées.

ATJ
la source
1
La citation s'adresse à: Kruschke, JK, Aguinis, H., et Joo, H. (2012). Le moment est venu: méthodes bayésiennes pour l'analyse des données dans les sciences organisationnelles. Mais Kruschke l'a déjà utilisé dans: (2010) l'analyse des données bayésiennes et (2010) Que croire: les méthodes bayésiennes pour l'analyse des données.
ATJ

Réponses:

21

n

n

XnX¯kμ=0μ0L(0)L(X¯)e-k2/2kKadane (1996), "Reasoning to a forone conclusion", JASA , 91 , 435

Souligner la dépendance de l'inférence fréquentiste à l'égard des intentions d'un chercheur est une fouille pratique des personnes (s'il y en a encore) qui montent à cheval sur la «subjectivité» de l'inférence bayésienne. Personnellement, je peux vivre avec; la performance d'une procédure sur une longue série de répétitions va toujours être quelque chose de plus ou moins théorique, ce qui ne l'empêche pas d'être une chose utile à considérer («un étalonnage de la probabilité» était la façon dont Cox décrivait les valeurs de p ). D'après les dates des références, vous avez peut-être remarqué que ces problèmes ne sont pas très nouveaux; les tentatives de les régler par une argumentation a priori se sont en grande partie éteintes (sauf sur Internet, toujours en retard, sauf dans les affaires triviales) &

PS: En pensant ajouter un contrepoids à Berger et Wolpert, je suis tombé sur Cox et Mayo (2010), "Objectivité et conditionnalité dans l'inférence fréquenciste" dans Erreur et inférence . Il y a très probablement un élément de vœux pieux dans mon affirmation selon laquelle le débat s'est éteint, mais il est frappant de constater qu'il reste peu de choses à dire sur la question après un demi-siècle environ. (Tout de même, c'est une défense concise et éloquente des idées fréquentistes.)

Scortchi - Réintégrer Monica
la source
1
+1 (il y a longtemps). Je me demande si le raisonnement d'Armitage peut être adapté à l'exemple bien connu d'échantillonnage binomial vs négatif bin-binomial; Par exemple, l' observation de la séquence TTTTTH de lancers de pièces donne p = 0,03 ou p = 0,1 selon la règle d'arrêt. Donc, si nous considérons maintenant une autre règle d'arrêt, par exemple "Continuez à lancer jusqu'à ce que le binôme p <0,05 et qu'il y ait au moins un H et au moins un T", alors il devient plutôt intuitif de ne pas ignorer cette règle d'arrêt pour l'inférence. (malgré la violation du principe de vraisemblance). Est-ce que ça a du sens?
amibe dit Réintégrer Monica
4

La réponse courte à votre question est: cela dépend de qui vous demandez ;-) Les Bayésiens purs et durs déclareront la victoire, ou du moins la parité avec, la méthodologie fréquentiste. Les habitués purs et durs auront par défaut "Cela ne peut pas être répondu". Les 99% restants des statisticiens utiliseront toutes les méthodes qui se sont révélées fiables dans le cadre d'expériences ininterrompues.

Je sais que la sensibilité de la distribution d'échantillonnage aux intentions du chercheur peut être troublante, et il n'y a vraiment pas de bonne solution à ce problème. Les bayésiens et les fréquentistes doivent utiliser une certaine subjectivité et un certain jugement pour décider comment former une inférence. Cependant, je pense que vous prenez un exemple dans un domaine généralement controversé et que vous posez les problèmes uniquement aux pieds de l'inférence fréquentiste. Les expériences séquentielles et / ou interrompues sont des exemples classiques de la nature subjective de l'inférence ... et auxquelles il n'y a pas de réponse absolument objective et convenue.

Qu'en est-il de l'inférence régulière, où vous collectez réellement l'échantillon que vous aviez l'intention d'obtenir? Ici, je pense que les fréquentistes ont le dessus, car les valeurs CI et p sont bien calibrées par rapport à leurs propriétés d'échantillonnage répétées, tandis que l'inférence bayésienne conserve sa nature personnelle et subjective.

Si vous voulez une présentation plus théorique de la réponse bayésienne, je lirais sur "l'inférence conditionnelle" avec des chercheurs clés étant Nancy Reid et Lehmann.

Scortchi - Réintégrer Monica
la source