Pouvez-vous m'aider à comprendre le point de vue fréquentiste dans le débat bayésien vs fréquentiste? J'ai beaucoup lu et toutes les sources que j'ai trouvées sont remplies d'équations complexes ou écrites d'un point de vue bayésien, ou les deux. Je n'ai pas trouvé un seul problème d'échantillon où l'approche fréquentiste produirait une sortie plus utile que l'approche bayésienne. J'ai l'impression de ne comprendre qu'un côté de ce débat et j'aimerais aussi comprendre l'autre côté. Je n'ai aucune expérience en statistique, donc j'apprécierais des exemples simples de cas où les méthodes fréquentistes produisent plus de valeur que les méthodes bayésiennes.
Un bon exemple serait un scénario de pari où un fréquentateur et un bayésien parieraient l'un contre l'autre sur un résultat futur et le fréquentateur a une valeur attendue positive.
la source
Réponses:
Je ne vous donnerai pas cet exemple car un tel exemple favoriserait une approche bayésienne à moins que le bayésien ne choisisse un mauvais avant qui est un exemple de dérobade qui ne vaut pas vraiment la peine d'être écrit.
L'approche la plus fréquente n'est pas conçue pour obtenir la valeur attendue la plus élevée dans les scénarios de paris (heureusement, le monde des statistiques et des probabilités est beaucoup plus large que cela). Au contraire, les techniques fréquentistes sont conçues pour garantir certaines propriétés de fréquence souhaitables, en particulier celle de la couverture. Ces propriétés sont importantes pour l'estimation et l'inférence de paramètres dans le contexte de la recherche et de la recherche scientifiques.
Je vous encourage à consulter ce lien ici vers un article de blog du Dr Larry Wasserman. Il y parle plus en détail des garanties de fréquence (voir les exemples qu'il donne).
Supposons que nous disposions de donnéesOui et nous pensons qu'il est distribué selon une distribution conditionnelle Oui∼ f( O|θ∗) (si vous aimez, vous pouvez imaginer que Oui est normalement distribué et θ∗ est la moyenne et / ou la variance). Nous ne connaissons pas la valeur deθ∗ , nous devons donc l'estimer. Pour ce faire, nous pouvons utiliser une approche fréquentiste ou bayésienne.
Dans l'approche fréquentiste, nous obtiendrions une estimation ponctuelleθ^ et un intervalle de confiance pour cette estimation. En supposantθ∗ existe et le modèle est valide et bien comporté, le fréquentiste( 1 - α ) l'intervalle de confiance est garanti pour contenir θ∗ (1−α) % du temps quel que soit θ∗ est en fait . θ∗ pourrait être 0, il pourrait être 1 000 000, il pourrait être -53,2, cela n'a pas d'importance, la déclaration ci-dessus est vraie.
Cependant, ce qui précède n'est pas vrai pour les intervalles de confiance bayésiens, autrement appelés intervalles crédibles. En effet, dans un cadre bayésien, nous devons spécifier unθ∼π(θ) et simuler à partir de la partie postérieure, π(θ|Y)∝f(Y|θ)π(θ) . Nous pouvons former(1−α) % d'intervalles crédibles utilisant l'échantillon résultant, mais la probabilité que ces intervalles contiennent θ∗ dépend de la probabilité θ∗ est sous notre préalable.
Dans un scénario de paris, nous pouvons penser que certaines valeurs sont moins susceptibles d'êtreθ∗ puis d'autres, et nous pouvons attribuer un avant pour refléter ces croyances. Si nos croyances sont exactes, la probabilité de contenirθ∗ dans l'intervalle crédible est plus élevé. C'est pourquoi les gens intelligents utilisant des techniques bayésiennes dans les scénarios de paris battent le fréquentiste.
Mais considérez un scénario différent, comme une étude où vous testez l'effet de l'éducation sur les salaires, appelez-leβ , dans un modèle de régression. Beaucoup de chercheurs préféreraient l'intervalle de confiance deβ d'avoir la propriété de fréquence de la couverture plutôt que de refléter leurs propres degrés de croyance concernant l'effet de l'éducation sur les salaires.
D'un point de vue pragmatique, il convient également de noter que dans mon exemple précédent, à mesure que la taille de l'échantillon approche de l'infini, lesθ^ et bayésien postérieur π(θ|Y) converger vers θ∗ . Ainsi, à mesure que vous obtenez de plus en plus de données, la différence entre l'approche bayésienne et fréquentiste devient négligeable. Étant donné que l'estimation bayésienne est souvent (pas toujours) plus rigoureuse sur le plan mathématique et mathématique que l'estimation fréquentiste, les praticiens optent souvent pour des techniques fréquentistes lorsqu'ils disposent de «grands» ensembles de données. Cela est vrai même lorsque l'objectif principal est la prédiction par opposition à l'estimation / l'inférence de paramètres.
la source