Trois problèmes philosophiques ouverts en statistique

9

J'ai récemment fini de lire The Lady Tasting Tea , un livre amusant sur l'histoire des statistiques. À la fin du livre, l'auteur, David Salsburg , propose trois problèmes philosophiques ouverts en statistique, dont les solutions selon lui auraient des implications plus importantes pour l'application de la théorie statistique à la science. Je n'avais jamais entendu parler de ces problèmes auparavant, je suis donc intéressé par les réactions des autres. Je m'aventure dans un territoire que je connais peu, alors je vais juste décrire la représentation de ces problèmes par Salsburg et poser deux questions générales sur ces problèmes ci-dessous.

Les problèmes philosophiques de Salsburg sont:

  1. Peut-on utiliser des modèles statistiques pour prendre des décisions?
  2. Quelle est la signification de la probabilité lorsqu'elle est appliquée à la vie réelle?
  3. Les gens comprennent-ils vraiment la probabilité?

Statistiques et prise de décision

Pour illustrer le problème présenté à la question 1, Salsburg présente le paradoxe suivant. Supposons que nous organisions une loterie avec 10000 billets non numérotés. Si nous utilisons la probabilité pour décider si un billet donné gagnera à la loterie en rejetant cette hypothèse pour les billets avec des probabilités inférieures, par exemple, 001, nous rejetterons l'hypothèse d'un billet gagnant pour tous les billets de la loterie!

Salsburg utilise cet exemple pour faire valoir que la logique est incompatible avec la théorie des probabilités telle que la théorie des probabilités est actuellement comprise, et que, par conséquent, nous n'avons actuellement pas de bons moyens d'intégrer les statistiques (qui, dans sa forme moderne, sont basées en grande partie sur théorie des probabilités) avec un moyen logique de prise de décision.

Le sens de la probabilité

En tant qu'abstraction mathématique, Salsburg soutient que la probabilité fonctionne bien, mais lorsque nous essayons d'appliquer les résultats à la vie réelle, nous nous heurtons au problème que la probabilité n'a pas de signification concrète dans la vie réelle. Plus précisément, lorsque nous disons qu'il y a 95% de chances de pluie demain, il n'est pas clair à quelles entités ces 95% s'appliquent. Cela s'applique-t-il à l'ensemble des expériences possibles que nous pourrions mener pour obtenir des connaissances sur la pluie? Cela s'applique-t-il à l'ensemble des personnes qui pourraient sortir et se mouiller? Salsburg soutient que l'absence de moyen d'interpréter les probabilités crée des problèmes pour tout modèle statistique basé sur la probabilité (c'est-à-dire la plupart d'entre eux).

Les gens comprennent-ils la probabilité?

Salsburg soutient qu'une tentative de résoudre les problèmes avec le manque de moyens concrets d'interprétation des probabilités passe par le concept de " probabilité personnelle ", proposé par Jimmie Savage et Bruno de Finetti, qui comprend la probabilité comme une croyance personnelle quant à la probabilité d'événements futurs. Cependant, pour que la probabilité personnelle fournisse une base cohérente pour la probabilité, les gens doivent avoir une compréhension commune de ce qu'est la probabilité et un moyen commun d'utiliser des preuves pour tirer des conclusions sur la probabilité. Malheureusement, des preuves telles que celles produites par Kahneman et Tversky suggèrent que les croyances personnelles pourraient être une base difficile sur laquelle créer une base cohérente de probabilité. Salsburg suggère que les méthodes statistiques qui modélisent les probabilités comme des croyances (peut-être comme les méthodes bayésiennes? J'étends mes connaissances ici) devront traiter ce problème.

Mes questions

  1. Dans quelle mesure les problèmes de Salsburg sont-ils vraiment des problèmes pour les statistiques modernes?
  2. Avons-nous progressé dans la recherche de solutions à ces problèmes?
Patrick S. Forscher
la source
1
+1 Vous trouverez une discussion approfondie de (1) et (3) - avec des réponses empiriques précises - dans le livre de Daniel Kahnemann Thinking, Fast and Slow (2011).
whuber
2
J'aurais besoin de relire le livre, mais (1) semble être une utilisation assez étrange des probabilités pour la prise de décision. Vous n'avez pas besoin de rejeter des hypothèses pour prendre des décisions, prendre la décision qui maximise le retour attendu est parfaitement valide, et dans ce cas, vous dirait que tout billet de loterie est aussi bon que n'importe quel autre (à l'exclusion de la prise en compte du comportement des autres clients ).
Dikran Marsupial
3
Je dois dire que j'ai eu du mal à lire après le premier "paradoxe"; un auteur qui se prononce sur les statistiques et la prise de décision alors qu'il semblerait, n'ayant aucune connaissance de la prise de décision statistique, qu'il ne faut pas se fier à l'applicabilité des statistiques en général. En outre, comme l'ont montré Russell et Whitehead, la logique fait partie des mathématiques, et bien sûr la théorie des probabilités, de sorte qu'elles ne peuvent pas être incompatibles les unes avec les autres - à moins que les mathématiques elles-mêmes soient incohérentes en interne. Quant au paradoxe n ° 2, demandez à tout actuaire ou joueur de savoir si la probabilité peut être appliquée à la vie réelle.
jbowman
"Quand nous disons qu'il y a 95% de chances de pluie demain, on ne sait pas à quelles entités ces 95% s'appliquent", explique Gigerenzer (par exemple dans "Risk Savvy"), mais de manière entièrement pratique et non philosophique. Il suggère qu'au moins vous énoncez 95% de ce que (pour les prévisions météorologiques: généralement des jours similaires à demain), ou mieux: que 19 sur 20 de ces jours ont eu de la pluie et donnez une définition de ce que signifie la «pluie» Plus précisément. Il soutient également que les écoliers peuvent comprendre de telles déclarations, mais presque personne ne peut le faire si les informations vitales sur le dénominateur sont omises.
cbeleites mécontents de SX

Réponses:

4

Pouvons-nous utiliser des statistiques / probabilités pour prendre des décisions? Bien sûr, nous pouvons, la façon dont nous devons procéder à ce sujet est de choisir la ligne de conduite qui minimise notre perte attendue. Dans ce cas, tous les numéros de loterie sont également susceptibles d'apparaître; si tous fournissent le même prix, la perte attendue est la même pour n'importe quel numéro, donc peu importe ce que nous choisissons. Si nous avons également la possibilité de ne pas jouer à la loterie, ce serait probablement le plan d'action que nous devrions prendre car cela minimisera nos pertes attendues en supposant que la loterie fait des bénéfices pour quelqu'un (ou au moins couvre les frais de fonctionnement de la loterie). ). Bien sûr, ce n'est que du bon sens et conforme à la logique, et pourrait être exprimé en termes purement probabilistes.

Il me semble que la question découle d'une vision assez limitée de la façon dont les statistiques peuvent être utilisées pour prendre des décisions, cela ne doit pas être fait avec des tests d'hypothèse quasi-Fisherian.

Je dirais que le livre de Jaynes sur la théorie des probabilités aborde de manière équitable les points (2) et (3), les probabilités peuvent représenter des mesures objectives de la plausibilité sans qu'elles soient des "probabilités personnelles", mais je m'attends à ce que @probabilityislogic puisse expliquer cela mieux que moi pouvez.

Dikran Marsupial
la source
4

Je ne pense pas que ce soient vraiment des questions auxquelles on puisse répondre de manière concluante. (IOW, ils sont, en effet, philosophiques). Cela dit...

Statistiques et prise de décision

Oui, nous pouvons utiliser des statistiques dans la prise de décision.

Cependant, il existe des limites à son applicabilité; IOW, il faut comprendre ce que l'on fait.

Ceci est pleinement applicable à toute théorie.

Le sens de la probabilité

95% de probabilité de pluie demain signifie que si votre coût de préparation à une pluie (par exemple, prendre le parapluie) est Aet votre coût d'être pris sous la pluie sans préparation (par exemple, combinaison humide) l'est B, alors vous devriez prendre le parapluie avec vous ssi A < 0.95 * B .

Les gens comprennent-ils la probabilité?

Non, les gens ne comprennent pas grand-chose, et surtout pas la probabilité.

Kahneman et Tversky ont montré que l'intuition humaine est défectueuse à plusieurs niveaux, mais l' intuition et la compréhension ne sont pas identiques, et je dirais que les gens comprennent encore moins qu'ils ne le pensent.

Dans quelle mesure les problèmes de Salsburg sont-ils vraiment des problèmes pour les statistiques modernes?

Néant. Je ne pense pas que quiconque se soucie de ces questions, sauf les philosophes et ceux qui sont d'humeur philosophique.

Avons-nous progressé dans la recherche de solutions à ces problèmes?

Tous ceux qui se soucient ont une résolution. Ma résolution personnelle est au-dessus.

sds
la source