Lors de la participation à des conférences, les partisans des statistiques bayésiennes ont poussé un peu à évaluer les résultats des expériences. Elle est considérée comme à la fois plus sensible, appropriée et sélective vis-à-vis des découvertes authentiques (moins de faux positifs) que les statistiques fréquentistes.
J'ai exploré un peu le sujet et je ne suis pas convaincu jusqu'à présent des avantages de l'utilisation des statistiques bayésiennes. Les analyses bayésiennes ont été utilisées pour réfuter les recherches de Daryl Bem soutenant la précognition, cependant, je reste donc prudemment curieux de savoir comment les analyses bayésiennes pourraient bénéficier même à mes propres recherches.
Je suis donc curieux de savoir ce qui suit:
- Puissance dans une analyse bayésienne vs une analyse fréquentiste
- Sensibilité à l'erreur de type 1 dans chaque type d'analyse
- Le compromis entre la complexité de l'analyse (le bayésien semble plus compliqué) et les avantages obtenus. Les analyses statistiques traditionnelles sont simples, avec des directives bien établies pour tirer des conclusions. La simplicité pourrait être considérée comme un avantage. Est-ce que cela vaut la peine d’abandonner?
Merci pour tout aperçu!
la source
Réponses:
Une réponse rapide au contenu à puces:
1) Erreur de puissance / type 1 dans une analyse bayésienne vs une analyse fréquentiste
Poser des questions sur le type 1 et la puissance (c'est-à-dire un moins la probabilité d'erreur de type 2) implique que vous pouvez placer votre problème d'inférence dans un cadre d'échantillonnage répété. Peut tu? Si vous ne pouvez pas, il n'y a pas d'autre choix que de vous éloigner des outils d'inférence fréquentiste. Si vous le pouvez, et si le comportement de votre estimateur sur de nombreux échantillons de ce type est pertinent, et si vous n'êtes pas particulièrement intéressé à faire des énoncés de probabilité sur des événements particuliers, alors je n'ai aucune raison valable de bouger.
L'argument ici n'est pas que de telles situations ne se produisent jamais - certainement elles le font - mais qu'elles ne se produisent généralement pas dans les domaines où les méthodes sont appliquées.
2) Le compromis entre la complexité de l'analyse (le bayésien semble plus compliqué) et les avantages obtenus.
Il est important de se demander où va la complexité. Dans les procédures fréquentistes, la mise en œuvre peut être très simple, par exemple minimiser la somme des carrés, mais les principes peuvent être arbitrairement complexes, tournant généralement autour de quel (s) estimateur (s) choisir, comment trouver le (s) bon (s) test (s), que penser quand ils sont en désaccord. À titre d'exemple. voir la discussion toujours animée, reprise dans ce forum, de différents intervalles de confiance pour une proportion!
Dans les procédures bayésiennes, la mise en œuvre peut être arbitrairement complexe même dans des modèles qui semblent devoir «être» simples, généralement en raison d'intégrales difficiles, mais les principes sont extrêmement simples. Cela dépend plutôt de l'endroit où vous aimeriez être en désordre.
3) Les analyses statistiques traditionnelles sont simples, avec des directives bien établies pour tirer des conclusions.
Personnellement, je ne me souviens plus, mais mes étudiants n'ont certainement jamais trouvé cela simple, principalement en raison de la prolifération des principes décrite ci-dessus. Mais la question n'est pas vraiment de savoir si une procédure est simple, mais si elle est plus proche d'avoir raison étant donné la structure du problème.
Enfin, je ne suis pas du tout d'accord qu'il existe des "lignes directrices bien établies pour tirer des conclusions" dans l'un ou l'autre paradigme. Et je pense que c'est une bonne chose. Bien sûr, "trouver p <0,05" est une ligne directrice claire, mais pour quel modèle, avec quelles corrections, etc.? Et que dois-je faire lorsque mes tests ne concordent pas? Un jugement scientifique ou technique est nécessaire ici, comme ailleurs.
la source
Les statistiques bayésiennes peuvent être dérivées de quelques principes logiques. Essayez de rechercher «probabilité comme logique étendue» et vous trouverez une analyse plus approfondie des principes fondamentaux. Mais fondamentalement, les statistiques bayésiennes reposent sur trois "desiderata" de base ou principes normatifs:
Ces trois desiderata (ainsi que les règles de la logique et de la théorie des ensembles) déterminent de manière unique les règles de somme et de produit de la théorie des probabilités. Ainsi, si vous souhaitez raisonner en fonction des trois desiderata ci-dessus, vous devez adopter une approche bayésienne. Vous n'êtes pas obligé d'adopter la "philosophie bayésienne" mais vous devez adopter les résultats numériques. Les trois premiers chapitres de ce livre les décrivent plus en détail et en fournissent la preuve.
Enfin et surtout, la «machinerie bayésienne» est l'outil de traitement de données le plus puissant dont vous disposez. Cela est principalement dû à la desiderata 3c) en utilisant toutes les informations dont vous disposez (cela explique également pourquoi les Bayes peuvent être plus compliqués que les non-Bayes). Il peut être assez difficile de décider «ce qui est pertinent» en utilisant votre intuition. Le théorème de Bayes le fait pour vous (et il le fait sans ajouter d'hypothèses arbitraires, également en raison de 3c).
Maintenant, si le calcul devient "trop difficile", vous devez alors approximer les chiffres ou ignorer certaines informations.
Pour un exemple réel avec des chiffres élaborés, voir ma réponse à cette question
la source
Je ne connais pas moi-même les statistiques bayésiennes, mais je sais que l'épisode 294 du Guide des sceptiques contient une interview d'Eric-Jan Wagenmakers où ils discutent des statistiques bayésiennes. Voici un lien vers le podcast: http://www.theskepticsguide.org/archive/podcastinfo.aspx?mid=1&pid=294
la source