Je ne sais pas si c'est juste moi, mais je suis très sceptique vis-à-vis des statistiques en général. Je peux le comprendre dans les jeux de dés, les jeux de poker, etc. Les jeux répétés très petits, simples et pour la plupart autonomes sont très bien. Par exemple, une pièce atterrissant sur son bord est suffisamment petite pour accepter la probabilité que la tête ou la queue d'atterrissage soit d'environ 50%.
Jouer à un jeu de poker à 10 $ visant à gagner 95% est très bien. Mais que se passe-t-il si toutes vos économies de vie + plus dépendent de votre victoire ou non? Comment le fait de savoir que vous gagneriez dans 95% des cas dans cette situation m'aiderait-il? La valeur attendue n'y aide pas beaucoup.
D'autres exemples incluent une chirurgie potentiellement mortelle. Comment cela aide-t-il à savoir qu'il s'agit d'un taux de survie de 51% contre un taux de survie de 99% compte tenu des données existantes? Dans les deux cas, je ne pense pas que cela importera pour moi ce que le médecin me dira, et j'irais bien. Si les données réelles sont de 75%, il pourrait aussi bien me dire (sauf éthique et droit), qu'il y a 99,99999% de chances de survie, donc je me sentirais mieux. En d'autres termes, les données existantes n'ont pas d'importance, sauf de façon binomiale. Même alors, peu importe s'il y a un taux de survie de 99,99999%, si je finis par en mourir.
Aussi, probabilité de tremblement de terre. Peu importe qu'un fort tremblement de terre se produise tous les x (où x> 100) ans en moyenne. Je n'ai aucune idée si un tremblement de terre se produira jamais dans ma vie. Alors pourquoi est-ce même une information utile?
Un exemple moins sérieux, disons, 100% des endroits où je suis allé que j'aime sont dans les Amériques, indifférents à 100% des endroits où je suis allé en Europe et détestent 100% des endroits que j'ai été en Asie. Maintenant, cela ne signifie nullement que je ne trouverais pas un endroit que j'aime en Asie lors de mon prochain voyage ou que je déteste en Europe ou indifférent en Amérique, juste par la nature même que les statistiques ne saisissent pas toutes les informations que je besoin, et je ne pourrai probablement jamais capturer toutes les informations dont j'ai besoin, même si j'ai voyagé sur plus de x% de tous ces continents. Tout simplement parce qu'il y a des inconnues dans le 1-x% de ces continents où je ne suis pas allé. (N'hésitez pas à remplacer le 100% par tout autre pourcentage).
Je comprends qu'il n'y a aucun moyen de tout forcer brutalement et que vous devez vous fier aux statistiques dans de nombreuses situations, mais comment pouvons-nous croire que les statistiques sont utiles dans notre situation ponctuelle, en particulier lorsque les statistiques ne sont pas extrapolées aux événements aberrants?
Des idées pour surmonter mon scepticisme des statistiques?
la source
Réponses:
Tout d'abord, je pense que vous pouvez confondre "statistiques" signifiant une collection de chiffres ou d'autres faits décrivant un groupe ou une situation, et "statistiques" signifiant la science de l'utilisation des données et des informations pour comprendre le monde face à la variation (d'autres peuvent être pouvoir améliorer mes définitions). Les statisticiens utilisent les deux sens du mot, il n'est donc pas surprenant que les gens les confondent.
La statistique (la science) consiste beaucoup à choisir des stratégies et à choisir la meilleure stratégie même si nous ne pouvons l'appliquer qu'une seule fois. Parfois, lorsque j'enseigne la probabilité (et d'autres), nous utilisons le problème classique de Monty Hall (3 portes, 2 chèvres, 1 voiture) pour le motiver et nous montrons comment nous pouvons estimer les probabilités en jouant au jeu plusieurs fois (pas pour les prix) ) et nous pouvons voir que la stratégie "switch" gagne 2/3 du temps et la stratégie "stay" ne gagne que 1/3 du temps. Maintenant, si nous avions la possibilité de jouer au jeu une seule fois, nous saurions certaines choses sur la stratégie qui donne les meilleures chances de gagner.
L'exemple de la chirurgie est similaire, vous ne subirez la chirurgie (ou ne la subirez pas) une seule fois, mais vous ne voulez pas savoir quelle stratégie profite à plus de gens? Si vos choix sont la chirurgie avec une chance supérieure à 0% de survie ou sans chirurgie et 0% de survie, alors oui, il y a peu de différence entre la chirurgie ayant 51% de survie et 99,9% de survie. Mais s'il y a aussi d'autres options, vous pouvez choisir entre une intervention chirurgicale, ne rien faire (qui a 25% de survie) ou un changement de régime et d'exercice qui a 75% de survie (mais nécessite des efforts de votre part), non vous vous souciez de savoir si l'option de chirurgie a une survie de 51% contre 99%?
Pensez également au médecin, il fera plus que votre chirurgie. Si la chirurgie a une survie de 99,9%, il n'a aucune raison d'envisager des alternatives, mais si elle n'a qu'une survie de 51%, alors que cela peut être le meilleur choix aujourd'hui, il devrait chercher d'autres alternatives qui augmentent cette survie. Oui, même avec 90% de survie, il perdra certains patients, mais quelle stratégie lui donne les meilleures chances de sauver le plus de patients?
Ce matin, je portais ma ceinture de sécurité en conduisant (ma stratégie habituelle), mais je n'ai eu aucun accident, alors ma stratégie était-elle une perte de temps? Si je savais quand j'aurais un accident, je pourrais gagner du temps en ne mettant la ceinture de sécurité qu'à ces occasions et pas à d'autres. Mais je ne sais pas quand je serai dans un accident, donc je vais m'en tenir à ma stratégie de port de la ceinture de sécurité parce que je crois que cela me donnera la meilleure chance si jamais je suis dans un accident, même si cela signifie perdre un peu de temps et l'effort dans le pourcentage élevé (espérons-le 100%) de fois où il n'y a pas d'accident.
la source
Ce n'est pas parce que vous n'utilisez pas de statistiques dans votre vie quotidienne que le domaine ne vous affecte pas directement. Lorsque vous êtes chez le médecin et qu'il recommande un traitement par rapport à l'autre, vous pouvez parier que derrière cette recommandation, de nombreux essais cliniques ont utilisé des statistiques pour interpréter les résultats de leurs expériences.
Il s'avère que le concept de valeur attendue est également très utile même si vous ne l'utilisez pas personnellement. Votre exemple de parier votre épargne-vie ne tient pas compte de la façon dont vous êtes défavorable au risque. Dans d'autres situations, les risques peuvent être moins élevés ou lorsque les résultats ne sont pas catastrophiques. Les affaires, la finance, les contextes actuariels et autres en sont des exemples. Peut-être que vous émettez une police d'assurance habitation - alors tout à coup, connaître la probabilité qu'un tremblement de terre se produise dans une certaine période de temps est très important.
En fin de compte, les statistiques sont un excellent moyen de gérer l'incertitude. Votre dernier exemple, vous avez constitué des données sur les endroits que vous aimez voyager et affirmé que les statistiques diront que vous ne trouverez jamais un endroit en Asie que vous aimez. C'est tout simplement faux. Bien sûr, ces données vous feront croire que l'Asie est moins susceptible d'avoir un endroit que vous aimez, mais vous pouvez définir votre croyance antérieure comme vous voulez, et les statistiques vous diront comment mettre à jour votre croyance compte tenu des nouvelles données. De plus, cela vous permet de modifier votre croyance d'une manière de principe qui vous permettra d'agir rationnellement en présence d'incertitude.
la source
Le monde est stochastique et non déterministe. S'il était déterministe, les physiciens gouverneraient le monde et les statisticiens seraient sans emploi. Mais la réalité est que les statisticiens sont très demandés dans presque toutes les disciplines. Cela ne veut pas dire qu'il n'y a pas de place pour la physique et les autres sciences, mais les statistiques vont de pair avec la science et sont à la base de nombreuses découvertes scientifiques.
Assez de bavardage et de détails. J'ai travaillé les 17 dernières années dans l'industrie médicale, d'abord dans les dispositifs médicaux, puis les produits pharmaceutiques, et maintenant la recherche médicale générale. Des médicaments et des dispositifs médicaux qui améliorent la qualité de vie et souvent sauvent ou prolongent la vie sont développés et approuvés régulièrement dans ce pays et dans le monde. Aux États-Unis, l'approbation exige des preuves de sécurité et d'efficacité avant que la FDA ne permette la commercialisation d'un médicament ou d'un dispositif médical. Les preuves pour la FDA proviennent d'essais cliniques en plusieurs phases. Tous les essais cliniques nécessitent une conception statistique et des méthodes d'analyse valides. Rien n'est parfait. Les médicaments fonctionnent bien pour certaines personnes tandis que d'autres peuvent ne pas répondre ou auront des événements indésirables (mauvaises réactions pouvant provoquer des maladies ou la mort). Les essais séparent les médicaments inefficaces des médicaments efficaces. La plupart des médicaments échouent et il y a souvent un cycle de dix ans entre le stade précoce de développement et la fin de la phase III avec l'approbation et la commercialisation à la fin de l'essai. Une surveillance post-commercialisation qui requiert également des statistiques est ensuite appliquée pour s'assurer que le médicament fonctionne suffisamment bien pour la population générale. Parfois, la population générale pour laquelle le médicament est approuvé est un groupe moins restrictif que les patients éligibles aux essais cliniques. Parfois, les drogues s'avèrent dangereuses et se retirent du marché. Les statistiques aident dans tous les aspects de l'innocuité des médicaments. Une surveillance post-commercialisation qui requiert également des statistiques est ensuite appliquée pour s'assurer que le médicament fonctionne suffisamment bien pour la population générale. Parfois, la population générale pour laquelle le médicament est approuvé est un groupe moins restrictif que les patients éligibles aux essais cliniques. Parfois, les drogues s'avèrent dangereuses et se retirent du marché. Les statistiques aident dans tous les aspects de l'innocuité des médicaments. Une surveillance post-commercialisation qui requiert également des statistiques est ensuite appliquée pour s'assurer que le médicament fonctionne suffisamment bien pour la population générale. Parfois, la population générale pour laquelle le médicament est approuvé est un groupe moins restrictif que les patients éligibles aux essais cliniques. Parfois, les drogues s'avèrent dangereuses et se retirent du marché. Les statistiques aident dans tous les aspects de l'innocuité des médicaments.
Les statistiques ne sont pas parfaites. Nous vivons avec quelques erreurs dues au hasard et à l'incertitude. Mais c'est contrôlé et nos vies sont meilleures et les erreurs sont réduites par rapport à ce qu'elles auraient été si la science statistique n'avait pas été impliquée.
la source
J'ai moi-même les mêmes doutes quant à l'utilité de la probabilité et des statistiques lorsqu'il s'agit de prendre une décision sur un événement unique. À mon avis, connaître la probabilité, réelle ou estimée, est extrêmement important lorsque l'objectif est d'estimer les résultats d'échantillons, qu'il s'agisse d'un événement unique répété plusieurs fois ou d'un échantillon se noyant dans une certaine population. En bref, connaître la probabilité a plus de sens pour le casino qui, basé sur des calculs de probabilité, peut mettre les règles qui garantissent qu'il gagnerait à long terme (après plusieurs jeux) et non pour un joueur qui prétend jouer une fois, alors il gagnerait ou perdrait (ce sont les résultats lorsque l'expérience est exécutée une seule fois). C'est aussi important pour les généraux qui envisagent d'envoyer leurs soldats au combat avec le risque (probabilité) de perdre 10% d'entre eux, mais pas pour une certaine soudure (disons, John) qui ne fera que mourir ou survivre. Il y a tellement d'exemples comme ceux-ci dans la vraie vie.
Le point que je veux faire valoir est que, les probabilités et les statistiques sont non seulement utiles dans la vie réelle mais, plus précisément, elles sont un outil pour toutes les recherches scientifiques modernes et les règles de prise de décision. Cependant, il n'est pas correct de dire que la rationalité implique de s'appuyer sur la probabilité d'un événement unique, sans intention ni possibilité de le répéter, pour estimer le résultat. La tendance de la probabilité d'influencer la décision d'une certaine personne, en fonction de son degré d'aversion au risque, est évidemment subjective. Les risques évités et les amoureux des risques ont des attitudes (décisions) différentes envers la même loterie (la même valeur attendue).
la source
Le long et le court terme est que la probabilité est la généralisation unique de la logique vraie / fausse ordinaire à des degrés de croyance compris entre 0 et 1. Il s'agit de la soi-disant interprétation bayésienne logique de la probabilité, créée par RT Cox et plus tard défendue par ET Jaynes.
De plus, sous des hypothèses faibles, il peut être démontré que la bonne façon de classer les résultats incertains par préférence est de les classer par utilité attendue, la prévision étant prise en fonction de la distribution de probabilité sur les résultats.
Voir Robert Clemen, «Making Hard Decisions», pour une introduction et un exposé sur l'analyse des décisions appliquées qui est basée sur la probabilité bayésienne et l'utilité attendue.
Vous avez tout à fait raison d'être sceptique quant aux statistiques fréquentistes conventionnelles; par la conception de ses inventeurs (RA Fisher, J. Neyman, E. Pearson), il est limité aux événements répétitifs. Mais de nombreux problèmes quotidiens n'impliquent pas d'événements répétitifs. Que faire? L'approche typique consiste à combiner des chevilles carrées dans des trous ronds et à déplacer les poteaux de but. Honteux, vraiment.
la source
Je suis sceptique sur les statistiques pour les raisons suivantes.
Je suis convaincu que quiconque sans diplôme d'études supérieures en statistique n'a aucune idée de ce qu'il fait. Unf. il y a des millions de personnes à travers le monde qui font de la recherche sans diplôme d'études supérieures en statistique. J'étais un étudiant de premier cycle en mathématiques à l'Univeristy of Maryland College, Park. J'ai pris 4 400 cours de mathématiques de niveau. Tout ce que les enseignants ont fait, c'est vous apprendre à calculer des choses. Personne ne m'a appris à donner un sens à quoi que ce soit ou à faire une analyse statistique, sauf pour les tests d'hypothèse, ce qui n'a aucun sens pour 2 raisons.
1. Pour chaque test d'hypothèse qui m'a été enseigné, j'ai dû faire des hypothèses au préalable. Personne ne m'a appris avec quelle (s) hypothèse (s) je devais commencer. 2. Les valeurs P n'ont aucun sens logiquement. Un diplôme d'études supérieures en statistique pourrait vous apprendre ce qu'est réellement une valeur ap. Cependant, je suis convaincu qu'aucun étudiant de premier cycle ne sait comment l'utiliser. La définition de premier cycle suppose une probabilité que quelque chose dépende de l'hypothèse correcte. Logiquement, la définition n'a aucun sens. Pire encore, PERSONNE ne m'a jamais dit d'où venait la probabilité. J'ai en fait envoyé un courriel à presque tout mon département de mathématiques (plus de 200 personnes) si quelqu'un pouvait me donner une réponse. Les réponses les plus populaires et les seules étaient "il faudrait assumer les taux d'erreur pour la probabilité" (quand j'ai demandé aux gens comment cela s'était fait, ils m'ont tous répondu "
La même chose s'est produite lorsque j'ai recherché sur Google la signification de la valeur ap. Cela m'amène à la conclusion ...
Même un sig. nombre de professeurs de mathématiques et de statistiques n'ont aucune idée de la logique des statistiques. Je ne m'attends pas à ce que les gens aient une connaissance approfondie. Cependant, j'ai le sentiment que même un sig. % des chercheurs et des professeurs ne comprennent aucune des logiques sous-jacentes aux statistiques.
L'erreur statistique n'est pas la même chose que l'erreur réelle. Parce que les gens aiment utiliser des statistiques pour dériver des estimations pour des choses qui sont énormes, les gens aiment utiliser l'erreur statistique pour "masquer" le fait qu'ils n'ont aucune idée de ce qu'est l'erreur réelle.
Les gens utilisent de petits échantillons pour de grandes populations parce que la théorie statistique leur dit qu'ils peuvent. L'un de mes cours universitaires m'a appris que les gens aiment utiliser des données qui sont une estimation d'environ 30 écoles du pays pour montrer qu'il y a peu d'incidents violents dans les écoles de tout le pays. Il y a environ 100 000 écoles. Cela semble fou. Tout un mouvement populaire est basé sur une trentaine d'écoles dans tout le pays.
Les gens aiment faire de la charge de la preuve une statistique. Le Higgs Bossom n'a jamais été découvert. Il a été découvert statistiquement, mais cela ne veut rien dire. Une découverte purement statistique est inutile car personne ne connaît l'exactitude des statistiques.
Les gens aiment utiliser les statistiques pour faire des choix importants. Les statistiques peuvent être utilisées comme guide, mais personne ne sait à quel point elles sont exactes. Ce n'est pas parce qu'un problème semble impossible à résoudre que les statistiques sont la meilleure chose à faire. Le fait que les tests ADN soient basés sur des statistiques me donne des frissons. Puis-je obtenir la peine de mort uniquement à cause des statistiques? Un meurtrier pourrait-il être libéré de prison uniquement à cause des statistiques?
Je pense que les statistiques peuvent être utiles, mais seulement si elles ne sont pas utilisées comme conclusion. Je crois que les statistiques peuvent nous dire quelles sont certaines des possibilités. Ensuite, la logique, et non la logique statistique, devrait être utilisée pour prouver quelle (s) possibilité (s) est correcte.
la source