Dans un commentaire récemment publié ici, un commentateur a signalé un blog de Larry Wasserman qui souligne (sans aucune source) que l'inférence fréquentiste se heurte au principe de vraisemblance.
Le principe de vraisemblance dit simplement que les expériences produisant des fonctions de vraisemblance similaires devraient produire une inférence similaire.
Deux parties à cette question:
Quelles parties, saveur ou école d'inférence fréquentiste violent spécifiquement le principe de vraisemblance?
S'il y a un affrontement, devons-nous rejeter l'un ou l'autre? Si oui, alors lequel? Je vais suggérer, pour les besoins de la discussion, que si nous devons rejeter quelque chose, nous devons rejeter les parties de l'inférence fréquentiste qui s'affrontent, car Hacking et Royall m'ont convaincu que le principe de vraisemblance est axiomatique.
la source
Réponses:
La partie de l'approche fréquentiste qui se heurte au principe de vraisemblance est la théorie des tests statistiques (et le calcul de la valeur p). Il est généralement mis en évidence par l'exemple suivant.
Supposons que deux Frequentist veulent étudier une pièce biaisée, qui fait tourner les «têtes» avec une propabilité inconnue . Ils soupçonne qu'il est sollicité vers « queue », de sorte qu'ils postulent la même hypothèse nulle p = 1 / 2 et la même hypothèse alternative p < 1 / 2 .p p = 1 / deux p < 1 / deux
Le premier statisticien lance la pièce jusqu'à ce que les «têtes» se présentent, ce qui se produit 6 fois. Le second décide de lancer la pièce 6 fois et n'obtient qu'une seule tête dans le dernier lancer.
Selon le modèle du premier statisticien, la valeur de p est calculée comme suit:
Selon le modèle du deuxième statisticien, la valeur de p est calculée comme suit:
En remplaçant par , le premier trouve une valeur p égale à , le second trouve une valeur p égale à .1 / 2 1 / 2 5 = 0,03125 sept / 2 × 1 / 2 5 = 0,109375p 1 / 2 1 / 25= 0,03125 7 / 2 × une / 25= 0,109375
Donc, ils obtiennent des résultats différents parce qu'ils ont fait des choses différentes, non? Mais selon le principe de vraisemblance , ils devraient arriver à la même conclusion. En bref, le principe de vraisemblance stipule que la vraisemblance est tout ce qui compte pour l'inférence. Ainsi, le choc vient du fait que les deux observations ont la même probabilité, proportionnelle à (la probabilité est déterminée jusqu'à une constante de proportionnalité).p( 1 - p )5
Pour autant que je sache, la réponse à votre deuxième question est davantage une opinion débattue. J'essaie personnellement d'éviter d'effectuer des tests et de calculer les valeurs de p pour la raison ci-dessus, et pour d'autres expliqués dans ce blog .
EDIT: Maintenant que j'y pense, les estimations de par intervalles de confiance seraient également différentes. En fait, si les modèles sont différents, l'IC diffère par sa construction.p
la source
J'aime l'exemple de @ gui11aume (+1), mais il peut donner l'impression que la différence entre deux valeurs ne se produit qu'en raison des différentes règles d'arrêt utilisées par les deux expérimentateurs.p
En fait, je pense que c'est un phénomène beaucoup plus général. Considérez le deuxième expérimentateur dans la réponse de @ gui11aume: celui qui lance une pièce six fois et observe les têtes uniquement lors du dernier lancer. Les résultats ressemblent à ça: quelle est la valeur ? L'approche habituelle consisterait à calculer la probabilité qu'une pièce équitable aboutisse à une ou plusieurs têtes. Il y a possibilités sur un total de avec une ou plusieurs têtes, d'où le .p 7 64 p = 7 / 64 ≈ 0,109
Mais pourquoi ne pas prendre une autre statistique de test ? Par exemple, dans cette expérience, nous avons observé cinq queues d'affilée. Prenons la longueur de la plus longue séquence de queues comme statistique de test. Il y a possibilités avec cinq ou six queues de suite, donc .p = 3 / 64 ≈ 0,0473 p=3/64≈0.047
Donc, si dans ce cas le taux d'erreur était fixé à , le choix de la statistique de test peut facilement rendre les résultats significatifs ou non, et cela n'a rien à voir avec les règles d'arrêt en soi .α=0.05
Partie spéculative
Maintenant, philosophiquement, je dirais que le choix fréquentiste de la statistique de test est en quelque sorte vague similaire au choix bayésien de prior. Nous choisissons l'une ou l'autre statistique de test parce que nous pensons que la pièce injuste se comporterait de telle ou telle manière (et nous voulons avoir le pouvoir de détecter ce comportement). N'est-ce pas similaire à mettre la priorité sur les types de pièces?
Dans l'affirmative, le principe de vraisemblance selon lequel tous les éléments de preuve sont dans la vraisemblance ne s'oppose pas aux valeurs de , car la valeur de n'est alors pas seulement la "quantité de preuves". C'est "une mesure de surprise", mais quelque chose ne peut être une mesure de surprise que si cela explique ce qui nous surprendrait! La valeur tente de combiner en une seule quantité scalaire à la fois les preuves et une sorte d'anticipations antérieures (comme représenté dans le choix de la statistique de test). Dans l'affirmative, il ne faut pas la comparer à la vraisemblance elle-même, mais peut-être plutôt à la postérieure?p pp p p
Je serais très intéressé d'entendre quelques opinions sur cette partie spéculative, ici ou sur le chat.
Mise à jour après discussion avec @MichaelLew
Je crains que mon exemple ci-dessus ne soit à la hauteur de ce débat. Le choix d'une statistique de test différente entraîne également un changement dans la fonction de vraisemblance. Ainsi, deux valeurs différentes calculées ci-dessus correspondent à deux fonctions de vraisemblance différentes, et ne peuvent donc pas être un exemple de "conflit" entre le principe de vraisemblance et les valeurs . La beauté de l'exemple de @ gui11aume est que la fonction de vraisemblance reste exactement la même, même si les valeurs diffèrent.p pp p p
Je dois encore réfléchir à ce que cela signifie pour ma partie "spéculative" ci-dessus.
la source