J'ai récemment fini de lire The Lady Tasting Tea , un livre amusant sur l'histoire des statistiques. À la fin du livre, l'auteur, David Salsburg , propose trois problèmes philosophiques ouverts en statistique, dont les solutions selon lui auraient des implications plus importantes pour l'application de la théorie statistique à la science. Je n'avais jamais entendu parler de ces problèmes auparavant, je suis donc intéressé par les réactions des autres. Je m'aventure dans un territoire que je connais peu, alors je vais juste décrire la représentation de ces problèmes par Salsburg et poser deux questions générales sur ces problèmes ci-dessous.
Les problèmes philosophiques de Salsburg sont:
- Peut-on utiliser des modèles statistiques pour prendre des décisions?
- Quelle est la signification de la probabilité lorsqu'elle est appliquée à la vie réelle?
- Les gens comprennent-ils vraiment la probabilité?
Statistiques et prise de décision
Pour illustrer le problème présenté à la question 1, Salsburg présente le paradoxe suivant. Supposons que nous organisions une loterie avec 10000 billets non numérotés. Si nous utilisons la probabilité pour décider si un billet donné gagnera à la loterie en rejetant cette hypothèse pour les billets avec des probabilités inférieures, par exemple, 001, nous rejetterons l'hypothèse d'un billet gagnant pour tous les billets de la loterie!
Salsburg utilise cet exemple pour faire valoir que la logique est incompatible avec la théorie des probabilités telle que la théorie des probabilités est actuellement comprise, et que, par conséquent, nous n'avons actuellement pas de bons moyens d'intégrer les statistiques (qui, dans sa forme moderne, sont basées en grande partie sur théorie des probabilités) avec un moyen logique de prise de décision.
Le sens de la probabilité
En tant qu'abstraction mathématique, Salsburg soutient que la probabilité fonctionne bien, mais lorsque nous essayons d'appliquer les résultats à la vie réelle, nous nous heurtons au problème que la probabilité n'a pas de signification concrète dans la vie réelle. Plus précisément, lorsque nous disons qu'il y a 95% de chances de pluie demain, il n'est pas clair à quelles entités ces 95% s'appliquent. Cela s'applique-t-il à l'ensemble des expériences possibles que nous pourrions mener pour obtenir des connaissances sur la pluie? Cela s'applique-t-il à l'ensemble des personnes qui pourraient sortir et se mouiller? Salsburg soutient que l'absence de moyen d'interpréter les probabilités crée des problèmes pour tout modèle statistique basé sur la probabilité (c'est-à-dire la plupart d'entre eux).
Les gens comprennent-ils la probabilité?
Salsburg soutient qu'une tentative de résoudre les problèmes avec le manque de moyens concrets d'interprétation des probabilités passe par le concept de " probabilité personnelle ", proposé par Jimmie Savage et Bruno de Finetti, qui comprend la probabilité comme une croyance personnelle quant à la probabilité d'événements futurs. Cependant, pour que la probabilité personnelle fournisse une base cohérente pour la probabilité, les gens doivent avoir une compréhension commune de ce qu'est la probabilité et un moyen commun d'utiliser des preuves pour tirer des conclusions sur la probabilité. Malheureusement, des preuves telles que celles produites par Kahneman et Tversky suggèrent que les croyances personnelles pourraient être une base difficile sur laquelle créer une base cohérente de probabilité. Salsburg suggère que les méthodes statistiques qui modélisent les probabilités comme des croyances (peut-être comme les méthodes bayésiennes? J'étends mes connaissances ici) devront traiter ce problème.
Mes questions
- Dans quelle mesure les problèmes de Salsburg sont-ils vraiment des problèmes pour les statistiques modernes?
- Avons-nous progressé dans la recherche de solutions à ces problèmes?
la source
Réponses:
Pouvons-nous utiliser des statistiques / probabilités pour prendre des décisions? Bien sûr, nous pouvons, la façon dont nous devons procéder à ce sujet est de choisir la ligne de conduite qui minimise notre perte attendue. Dans ce cas, tous les numéros de loterie sont également susceptibles d'apparaître; si tous fournissent le même prix, la perte attendue est la même pour n'importe quel numéro, donc peu importe ce que nous choisissons. Si nous avons également la possibilité de ne pas jouer à la loterie, ce serait probablement le plan d'action que nous devrions prendre car cela minimisera nos pertes attendues en supposant que la loterie fait des bénéfices pour quelqu'un (ou au moins couvre les frais de fonctionnement de la loterie). ). Bien sûr, ce n'est que du bon sens et conforme à la logique, et pourrait être exprimé en termes purement probabilistes.
Il me semble que la question découle d'une vision assez limitée de la façon dont les statistiques peuvent être utilisées pour prendre des décisions, cela ne doit pas être fait avec des tests d'hypothèse quasi-Fisherian.
Je dirais que le livre de Jaynes sur la théorie des probabilités aborde de manière équitable les points (2) et (3), les probabilités peuvent représenter des mesures objectives de la plausibilité sans qu'elles soient des "probabilités personnelles", mais je m'attends à ce que @probabilityislogic puisse expliquer cela mieux que moi pouvez.
la source
Je ne pense pas que ce soient vraiment des questions auxquelles on puisse répondre de manière concluante. (IOW, ils sont, en effet, philosophiques). Cela dit...
Statistiques et prise de décision
Oui, nous pouvons utiliser des statistiques dans la prise de décision.
Cependant, il existe des limites à son applicabilité; IOW, il faut comprendre ce que l'on fait.
Ceci est pleinement applicable à toute théorie.
Le sens de la probabilité
95% de probabilité de pluie demain signifie que si votre coût de préparation à une pluie (par exemple, prendre le parapluie) est
A
et votre coût d'être pris sous la pluie sans préparation (par exemple, combinaison humide) l'estB
, alors vous devriez prendre le parapluie avec vous ssiA < 0.95 * B
.Les gens comprennent-ils la probabilité?
Non, les gens ne comprennent pas grand-chose, et surtout pas la probabilité.
Kahneman et Tversky ont montré que l'intuition humaine est défectueuse à plusieurs niveaux, mais l' intuition et la compréhension ne sont pas identiques, et je dirais que les gens comprennent encore moins qu'ils ne le pensent.
Dans quelle mesure les problèmes de Salsburg sont-ils vraiment des problèmes pour les statistiques modernes?
Néant. Je ne pense pas que quiconque se soucie de ces questions, sauf les philosophes et ceux qui sont d'humeur philosophique.
Avons-nous progressé dans la recherche de solutions à ces problèmes?
Tous ceux qui se soucient ont une résolution. Ma résolution personnelle est au-dessus.
la source