Pourquoi les statistiques sont-elles utiles lorsque beaucoup de choses importantes sont des choses à un coup?

18

Je ne sais pas si c'est juste moi, mais je suis très sceptique vis-à-vis des statistiques en général. Je peux le comprendre dans les jeux de dés, les jeux de poker, etc. Les jeux répétés très petits, simples et pour la plupart autonomes sont très bien. Par exemple, une pièce atterrissant sur son bord est suffisamment petite pour accepter la probabilité que la tête ou la queue d'atterrissage soit d'environ 50%.

Jouer à un jeu de poker à 10 $ visant à gagner 95% est très bien. Mais que se passe-t-il si toutes vos économies de vie + plus dépendent de votre victoire ou non? Comment le fait de savoir que vous gagneriez dans 95% des cas dans cette situation m'aiderait-il? La valeur attendue n'y aide pas beaucoup.

D'autres exemples incluent une chirurgie potentiellement mortelle. Comment cela aide-t-il à savoir qu'il s'agit d'un taux de survie de 51% contre un taux de survie de 99% compte tenu des données existantes? Dans les deux cas, je ne pense pas que cela importera pour moi ce que le médecin me dira, et j'irais bien. Si les données réelles sont de 75%, il pourrait aussi bien me dire (sauf éthique et droit), qu'il y a 99,99999% de chances de survie, donc je me sentirais mieux. En d'autres termes, les données existantes n'ont pas d'importance, sauf de façon binomiale. Même alors, peu importe s'il y a un taux de survie de 99,99999%, si je finis par en mourir.

Aussi, probabilité de tremblement de terre. Peu importe qu'un fort tremblement de terre se produise tous les x (où x> 100) ans en moyenne. Je n'ai aucune idée si un tremblement de terre se produira jamais dans ma vie. Alors pourquoi est-ce même une information utile?

Un exemple moins sérieux, disons, 100% des endroits où je suis allé que j'aime sont dans les Amériques, indifférents à 100% des endroits où je suis allé en Europe et détestent 100% des endroits que j'ai été en Asie. Maintenant, cela ne signifie nullement que je ne trouverais pas un endroit que j'aime en Asie lors de mon prochain voyage ou que je déteste en Europe ou indifférent en Amérique, juste par la nature même que les statistiques ne saisissent pas toutes les informations que je besoin, et je ne pourrai probablement jamais capturer toutes les informations dont j'ai besoin, même si j'ai voyagé sur plus de x% de tous ces continents. Tout simplement parce qu'il y a des inconnues dans le 1-x% de ces continents où je ne suis pas allé. (N'hésitez pas à remplacer le 100% par tout autre pourcentage).

Je comprends qu'il n'y a aucun moyen de tout forcer brutalement et que vous devez vous fier aux statistiques dans de nombreuses situations, mais comment pouvons-nous croire que les statistiques sont utiles dans notre situation ponctuelle, en particulier lorsque les statistiques ne sont pas extrapolées aux événements aberrants?

Des idées pour surmonter mon scepticisme des statistiques?

statskeptic
la source
5
(+1) Bienvenue sur notre site! Ce n'est pas seulement vous: c'est une question profonde qui va aux fondements de la statistique.
whuber
3
L'exemple des «économies de vie» mélange des problèmes distincts. En économie, un modèle commun d'aversion rationnelle au risque consiste à maximiser l'utilité attendue, et non l'argent attendu, où l'utilité est généralement une fonction concave (sublinéaire) comme log (argent). Cela signifie que les pertes coûtent plus cher que les gains de même taille, et cet effet est plus important pour des changements plus importants. C'est très différent de ne pas croire qu'il existe une différence entre et 99 % , ce qui conduit à un comportement incohérent et irrationnel. 50%99%
Douglas Zare,
@DouglasZare cela ressemble à un domaine très intéressant. Pouvez-vous fournir un article d'introduction au sujet de l'aversion individuelle au risque concernant l'épargne en direct?
steffen
@steffen: Ce matériel est couvert dans de nombreux textes économiques de base. La théorie de la maximisation de l'utilité attendue est considérée par beaucoup comme trop simple et insuffisante pour expliquer de nombreux phénomènes, mais c'est un point de départ important à comprendre avant de passer à des idées telles que la théorie des perspectives. Quelque chose qui s'explique facilement par la maximisation de l'utilité attendue au lieu de la maximisation de l'argent attendue ne doit pas être considéré comme un échec de la théorie des probabilités. en.wikipedia.org/wiki/Expected_utility_hypothesis
Douglas Zare
Cela me semble être un sujet et une discussion importants qui pourraient rester ouverts. (Je comprendrais si les gens voulaient en faire CW, cependant.)
gung - Réintègre Monica

Réponses:

25

Tout d'abord, je pense que vous pouvez confondre "statistiques" signifiant une collection de chiffres ou d'autres faits décrivant un groupe ou une situation, et "statistiques" signifiant la science de l'utilisation des données et des informations pour comprendre le monde face à la variation (d'autres peuvent être pouvoir améliorer mes définitions). Les statisticiens utilisent les deux sens du mot, il n'est donc pas surprenant que les gens les confondent.

La statistique (la science) consiste beaucoup à choisir des stratégies et à choisir la meilleure stratégie même si nous ne pouvons l'appliquer qu'une seule fois. Parfois, lorsque j'enseigne la probabilité (et d'autres), nous utilisons le problème classique de Monty Hall (3 portes, 2 chèvres, 1 voiture) pour le motiver et nous montrons comment nous pouvons estimer les probabilités en jouant au jeu plusieurs fois (pas pour les prix) ) et nous pouvons voir que la stratégie "switch" gagne 2/3 du temps et la stratégie "stay" ne gagne que 1/3 du temps. Maintenant, si nous avions la possibilité de jouer au jeu une seule fois, nous saurions certaines choses sur la stratégie qui donne les meilleures chances de gagner.

L'exemple de la chirurgie est similaire, vous ne subirez la chirurgie (ou ne la subirez pas) une seule fois, mais vous ne voulez pas savoir quelle stratégie profite à plus de gens? Si vos choix sont la chirurgie avec une chance supérieure à 0% de survie ou sans chirurgie et 0% de survie, alors oui, il y a peu de différence entre la chirurgie ayant 51% de survie et 99,9% de survie. Mais s'il y a aussi d'autres options, vous pouvez choisir entre une intervention chirurgicale, ne rien faire (qui a 25% de survie) ou un changement de régime et d'exercice qui a 75% de survie (mais nécessite des efforts de votre part), non vous vous souciez de savoir si l'option de chirurgie a une survie de 51% contre 99%?

Pensez également au médecin, il fera plus que votre chirurgie. Si la chirurgie a une survie de 99,9%, il n'a aucune raison d'envisager des alternatives, mais si elle n'a qu'une survie de 51%, alors que cela peut être le meilleur choix aujourd'hui, il devrait chercher d'autres alternatives qui augmentent cette survie. Oui, même avec 90% de survie, il perdra certains patients, mais quelle stratégie lui donne les meilleures chances de sauver le plus de patients?

Ce matin, je portais ma ceinture de sécurité en conduisant (ma stratégie habituelle), mais je n'ai eu aucun accident, alors ma stratégie était-elle une perte de temps? Si je savais quand j'aurais un accident, je pourrais gagner du temps en ne mettant la ceinture de sécurité qu'à ces occasions et pas à d'autres. Mais je ne sais pas quand je serai dans un accident, donc je vais m'en tenir à ma stratégie de port de la ceinture de sécurité parce que je crois que cela me donnera la meilleure chance si jamais je suis dans un accident, même si cela signifie perdre un peu de temps et l'effort dans le pourcentage élevé (espérons-le 100%) de fois où il n'y a pas d'accident.

Greg Snow
la source
+1 Greg Bon post! J'écrivais la mienne en même temps que toi. Nous pouvons nous chevaucher un peu, mais je pense que nous avions tous les deux des choses à dire qui étaient exactes et qui ne se chevauchaient pas. Je ne sais pas ce que le PO pense des statistiques. C'est bien que tu lui aies donné le bénéfice du doute. J'en ai pris une approche plus en colère.
Michael R. Chernick
Salut Greg, j'ai aimé ta réponse, mais puis-je la raisonner comme ceci: la statistique (la science) est elle-même une statistique, elle fonctionne pendant x% du temps, (peut-être un x élevé), mais il y a le 1-x% inconnu / facteurs aléatoires dont nous devons toujours être conscients. Étant donné que nous pouvons modéliser l'inconnu de n'importe quelle manière (éventuellement infinie), nous ne connaîtrons jamais x. Espérons que ces valeurs aberrantes ne se produiront jamais, mais nous devons toujours être attentifs et nous méprendre sur les conservateurs, surtout si l'événement est catastrophique (c.-à-d. Astéroïdes, produits financiers, accidents nucléaires pour la société et accidents de voiture pour les particuliers). Est-ce que ça a du sens?
statskeptic
@statskeptic, ce que vous dites s'applique à tous les domaines, pas seulement aux statistiques. En fait, cela s'applique moins aux vraies statistiques qu'aux autres champs parce que lorsque les statistiques sont bien faites, les hypothèses sont claires. La plupart du temps, les statistiques ont échoué. Ce ne sont pas les techniques, mais elles ont été mal appliquées. Dans n'importe quel domaine qui implique de l'incertitude (qui est à peu près autre chose que la religion ou les mathématiques pures, et même ils en ont), vous pouvez avoir une réponse qui est fausse, inutile ou utilise des statistiques.
Greg Snow
(+1) pour les statistiques étant "la science de l'utilisation des données et des informations pour comprendre le monde face à la variation"
demi-passe
4

Ce n'est pas parce que vous n'utilisez pas de statistiques dans votre vie quotidienne que le domaine ne vous affecte pas directement. Lorsque vous êtes chez le médecin et qu'il recommande un traitement par rapport à l'autre, vous pouvez parier que derrière cette recommandation, de nombreux essais cliniques ont utilisé des statistiques pour interpréter les résultats de leurs expériences.

Il s'avère que le concept de valeur attendue est également très utile même si vous ne l'utilisez pas personnellement. Votre exemple de parier votre épargne-vie ne tient pas compte de la façon dont vous êtes défavorable au risque. Dans d'autres situations, les risques peuvent être moins élevés ou lorsque les résultats ne sont pas catastrophiques. Les affaires, la finance, les contextes actuariels et autres en sont des exemples. Peut-être que vous émettez une police d'assurance habitation - alors tout à coup, connaître la probabilité qu'un tremblement de terre se produise dans une certaine période de temps est très important.

En fin de compte, les statistiques sont un excellent moyen de gérer l'incertitude. Votre dernier exemple, vous avez constitué des données sur les endroits que vous aimez voyager et affirmé que les statistiques diront que vous ne trouverez jamais un endroit en Asie que vous aimez. C'est tout simplement faux. Bien sûr, ces données vous feront croire que l'Asie est moins susceptible d'avoir un endroit que vous aimez, mais vous pouvez définir votre croyance antérieure comme vous voulez, et les statistiques vous diront comment mettre à jour votre croyance compte tenu des nouvelles données. De plus, cela vous permet de modifier votre croyance d'une manière de principe qui vous permettra d'agir rationnellement en présence d'incertitude.

jlund3
la source
L'exemple itinérant n'était qu'un exemple inventé, mais l'idée est que les statistiques ne saisissent pas l'inconnu. Votre exemple de contextes commerciaux m'a fait penser à l'exemple des compagnies d'assurance du WTC qui ont probablement estimé le coût / bénéfice de l'assurance du bâtiment sans tenir compte des avions détruisant le bâtiment, mais c'est pourtant celui qui comptait le plus.
statskeptic
+1 @ jjund3 pour répondre aux questions spécifiques des PO et pour mélanger les statistiques bayésiennes et fréquentistes sans aucun conflit.
Michael R. Chernick
@statskeptic Votre argument selon lequel les statistiques ne peuvent pas tenir compte de toutes les incertitudes possibles est bon. Mais il n'est pas nécessaire qu'il soit complet et parfait pour être utile. Nous connaissons les terroristes. Avant le 11 septembre, nous avions des exemples de terroristes qui partaient en mission suicide et nous avions l'expérience du détournement d'avion. Les informations auraient pu être rassemblées pour déterminer que l'écrasement d'un avion dans le World Trade Center était une possibilité bien que nous l'aurions probablement évaluée comme une possibilité éloignée.
Michael R. Chernick
Nous savions que le World Trade Center était une cible terroriste préférée. Il avait été attaqué une fois auparavant avec une bombe déclenchée au sous-sol. Le fait que la bombe n'était pas assez forte pour faire les dégâts souhaités était au moins un indice que la prochaine fois, une méthode très différente serait utilisée. Bien sûr, comme on l'a souvent dit, la vue arrière est de 20 à 20. Il existe de nombreux exemples où l'inattendu ou l'improbable se produit. Mais pas dans le cas de la catastrophe de Challanger. Là, les ingénieurs de Thiokol, même avec des données limitées, savaient qu'il y avait des risques d'une défaillance catastrophique due à une défaillance des joints toriques à basse température.
Michael R. Chernick
1
@statskeptic Votre argument est très similaire au scepticisme / dénigrement des statistiques de Taleb dans son livre The Black Swan. Je pense que de nombreux statisticiens moi-même ont fait des trous dans son argumentation qui dit fondamentalement que les statistiques sont inutiles car elles ne peuvent pas prédire cet événement rare et impensable (le 11 septembre dans votre exemple, le krach boursier dans le sien).
Michael R. Chernick
1

Le monde est stochastique et non déterministe. S'il était déterministe, les physiciens gouverneraient le monde et les statisticiens seraient sans emploi. Mais la réalité est que les statisticiens sont très demandés dans presque toutes les disciplines. Cela ne veut pas dire qu'il n'y a pas de place pour la physique et les autres sciences, mais les statistiques vont de pair avec la science et sont à la base de nombreuses découvertes scientifiques.

Assez de bavardage et de détails. J'ai travaillé les 17 dernières années dans l'industrie médicale, d'abord dans les dispositifs médicaux, puis les produits pharmaceutiques, et maintenant la recherche médicale générale. Des médicaments et des dispositifs médicaux qui améliorent la qualité de vie et souvent sauvent ou prolongent la vie sont développés et approuvés régulièrement dans ce pays et dans le monde. Aux États-Unis, l'approbation exige des preuves de sécurité et d'efficacité avant que la FDA ne permette la commercialisation d'un médicament ou d'un dispositif médical. Les preuves pour la FDA proviennent d'essais cliniques en plusieurs phases. Tous les essais cliniques nécessitent une conception statistique et des méthodes d'analyse valides. Rien n'est parfait. Les médicaments fonctionnent bien pour certaines personnes tandis que d'autres peuvent ne pas répondre ou auront des événements indésirables (mauvaises réactions pouvant provoquer des maladies ou la mort). Les essais séparent les médicaments inefficaces des médicaments efficaces. La plupart des médicaments échouent et il y a souvent un cycle de dix ans entre le stade précoce de développement et la fin de la phase III avec l'approbation et la commercialisation à la fin de l'essai. Une surveillance post-commercialisation qui requiert également des statistiques est ensuite appliquée pour s'assurer que le médicament fonctionne suffisamment bien pour la population générale. Parfois, la population générale pour laquelle le médicament est approuvé est un groupe moins restrictif que les patients éligibles aux essais cliniques. Parfois, les drogues s'avèrent dangereuses et se retirent du marché. Les statistiques aident dans tous les aspects de l'innocuité des médicaments. Une surveillance post-commercialisation qui requiert également des statistiques est ensuite appliquée pour s'assurer que le médicament fonctionne suffisamment bien pour la population générale. Parfois, la population générale pour laquelle le médicament est approuvé est un groupe moins restrictif que les patients éligibles aux essais cliniques. Parfois, les drogues s'avèrent dangereuses et se retirent du marché. Les statistiques aident dans tous les aspects de l'innocuité des médicaments. Une surveillance post-commercialisation qui requiert également des statistiques est ensuite appliquée pour s'assurer que le médicament fonctionne suffisamment bien pour la population générale. Parfois, la population générale pour laquelle le médicament est approuvé est un groupe moins restrictif que les patients éligibles aux essais cliniques. Parfois, les drogues s'avèrent dangereuses et se retirent du marché. Les statistiques aident dans tous les aspects de l'innocuité des médicaments.

Les statistiques ne sont pas parfaites. Nous vivons avec quelques erreurs dues au hasard et à l'incertitude. Mais c'est contrôlé et nos vies sont meilleures et les erreurs sont réduites par rapport à ce qu'elles auraient été si la science statistique n'avait pas été impliquée.

Michael R. Chernick
la source
Ne vous méprenez pas. Je comprends qu'il y a des statistiques dans tout, même la physique avec la mécanique quantique est une question de probabilité, et il n'y a pas assez d'atomes pour faire des calculs sans statistiques. Je veux juste savoir comment gérer le caractère aléatoire et l'incertitude qui peuvent influencer ma vie (ou celle d'autrui) plus que toute statistique ou distribution réelle.
statskeptic
Ok statskeptic donc vous n'êtes pas confus. Mais pourquoi est-il si difficile de voir comment les statistiques améliorent vos chances de succès. La théorie des probabilités vous indique les chances de gagner des jeux de hasard. Si vous pouvez utiliser la stratégie Beat the Dealer de Thorpe au blackjack et que vous disposez d'une grande banque de fonds, vous pouvez faire fortune à long terme. Les étudiants du MIT l'ont prouvé à Las Vegas, même si l'avantage du comptage a été réduit par l'utilisation de plusieurs ponts. C'est vrai. Le casino sait que les compteurs de cartes sont une menace.
Michael R. Chernick
Ils les recherchent et quand ils pensent en trouver un, ils le jettent hors du casino sans poser de questions.
Michael R. Chernick
De plus, ne pensez pas que j'essaie de mettre le feu à votre profession. Il y a des ordinateurs qui font des calculs statistiquement pour économiser de l'énergie, et je respecte cela. J'essaie simplement de savoir comment les gens qui ont beaucoup plus de connaissances que moi en statistiques traitent ces questions.
statskeptic
@statskeptic Je vous ai vu mon message d'origine, je m'excuse pour mes commentaires initiaux. Ils ont été édités à juste titre par un modérateur. Je pense que j'ai mal compris ce que vous essayez de dire. J'espère que nous avons bien répondu à votre question et soulagé une partie de votre scepticisme.
Michael R. Chernick
1

J'ai moi-même les mêmes doutes quant à l'utilité de la probabilité et des statistiques lorsqu'il s'agit de prendre une décision sur un événement unique. À mon avis, connaître la probabilité, réelle ou estimée, est extrêmement important lorsque l'objectif est d'estimer les résultats d'échantillons, qu'il s'agisse d'un événement unique répété plusieurs fois ou d'un échantillon se noyant dans une certaine population. En bref, connaître la probabilité a plus de sens pour le casino qui, basé sur des calculs de probabilité, peut mettre les règles qui garantissent qu'il gagnerait à long terme (après plusieurs jeux) et non pour un joueur qui prétend jouer une fois, alors il gagnerait ou perdrait (ce sont les résultats lorsque l'expérience est exécutée une seule fois). C'est aussi important pour les généraux qui envisagent d'envoyer leurs soldats au combat avec le risque (probabilité) de perdre 10% d'entre eux, mais pas pour une certaine soudure (disons, John) qui ne fera que mourir ou survivre. Il y a tellement d'exemples comme ceux-ci dans la vraie vie.

Le point que je veux faire valoir est que, les probabilités et les statistiques sont non seulement utiles dans la vie réelle mais, plus précisément, elles sont un outil pour toutes les recherches scientifiques modernes et les règles de prise de décision. Cependant, il n'est pas correct de dire que la rationalité implique de s'appuyer sur la probabilité d'un événement unique, sans intention ni possibilité de le répéter, pour estimer le résultat. La tendance de la probabilité d'influencer la décision d'une certaine personne, en fonction de son degré d'aversion au risque, est évidemment subjective. Les risques évités et les amoureux des risques ont des attitudes (décisions) différentes envers la même loterie (la même valeur attendue).

Mohamed Lemine
la source
Le point sur l'aversion au risque est intéressant, en ce qui concerne la façon dont les gens réagissent à un événement incertain. Mais notez que lorsque les économistes envisagent le choix dans l'incertitude (par exemple, les matières premières subordonnées à l'état du monde), la vraie probabilité entre en jeu via la ligne de cote équitable (une contrainte budgétaire reflétant les faisceaux possibles dans un pari actuariellement équitable). Les agents se comportent non seulement en fonction de leurs préférences (par exemple, l'aversion au risque), mais également en fonction de l'interaction de leur contrainte budgétaire (le pari disponible) et de leur évaluation de la ligne de cotes équitables.
Silverfish
En bref, il n'est pas vrai que toutes les personnes averses au risque "ne jouent jamais" (dans le sens le plus large du terme), juste qu'elles ne peuvent pas être tentées de jouer par des cotes actuariellement équitables. Une prime de risque suffisante (en fonction de leur degré d'aversion au risque) peut cependant modifier cette décision. Étant donné que cette analyse dépend de la perception par l'agent des chances équitables, même sur un coup unique, un agent rationnel évaluera les probabilités.
Silverfish
1- Je n'ai pas dit que les personnes averses au risque ne jouent jamais. 2-Ce que je voulais dire par «subjectif», c'est que connaître la valeur attendue d'une loterie ne détermine pas l'attitude d'une personne à son égard. Toutes choses égales par ailleurs, cette attitude est fonction d'une caractéristique personnelle qui est le degré d'aversion au risque qui détermine l'utilité attendue du pari. 3-La rationalité dans la théorie économique dépend d'hypothèses et est donc relative. C'est pourquoi deux individus montrant des attitudes différentes envers la même valeur attendue pourraient être tous deux appelés «rationnels».
Mohamed Lemine
Je souhaite que nous ne manquions pas le point central de cette discussion, qui concerne le fait que des événements à très faible probabilité peuvent avoir lieu dans n'importe quelle piste. et vice versa.
Mohamed Lemine
-4

Le long et le court terme est que la probabilité est la généralisation unique de la logique vraie / fausse ordinaire à des degrés de croyance compris entre 0 et 1. Il s'agit de la soi-disant interprétation bayésienne logique de la probabilité, créée par RT Cox et plus tard défendue par ET Jaynes.

De plus, sous des hypothèses faibles, il peut être démontré que la bonne façon de classer les résultats incertains par préférence est de les classer par utilité attendue, la prévision étant prise en fonction de la distribution de probabilité sur les résultats.

Voir Robert Clemen, «Making Hard Decisions», pour une introduction et un exposé sur l'analyse des décisions appliquées qui est basée sur la probabilité bayésienne et l'utilité attendue.

Vous avez tout à fait raison d'être sceptique quant aux statistiques fréquentistes conventionnelles; par la conception de ses inventeurs (RA Fisher, J. Neyman, E. Pearson), il est limité aux événements répétitifs. Mais de nombreux problèmes quotidiens n'impliquent pas d'événements répétitifs. Que faire? L'approche typique consiste à combiner des chevilles carrées dans des trous ronds et à déplacer les poteaux de but. Honteux, vraiment.

Robert Dodier
la source
4
-1 À mon avis, une représentation très pauvre et injuste des statistiques fréquentistes. Je ne voudrais pas avoir une telle opinion négative de l'approche bayésienne. Mais les Bayésiens (n'importe quel camp) ne sont pas exempts de critiques. Le degré de croyance doit-il être l'aliment de base de l'inférence? Le degré de croyance est-il subjectif et personnel, de sorte que deux personnes peuvent donner deux réponses différentes? Qu'en est-il de la nécessité d'une distribution préalable? Comment le choisir? Beaucoup de questions pour tout paradigme d'inférence. Mais ne sommes-nous pas passés au stade de la querelle des auberges de jeunesse sur les fondations?
Michael R. Chernick
5
Il y a plus sur la méthode scientifique pour nous unir et dire avec résonance que la STAISTIQUE EST IMPORTANTE face à un sceptique. Au lieu de cela, vous êtes d'accord avec le sceptique afin de tenter à bon marché les méthodes fréquentistes! Voilà ce qui est honteux.
Michael R. Chernick
@MichaelChernick: (1) simplement crier STATISTIQUES EST IMPORTANT n'est guère un argument qui séduira un sceptique. (2) L'inférence bayésienne a la même relation avec les données du problème que la logique ordinaire. Autrement dit, compte tenu de certaines prémisses, vous élaborez une solution en appliquant des lois de probabilité. Les données (par exemple, toute distribution antérieure) ne sont ni correctes ni erronées; ils le sont. Les gens raisonnables sont en désaccord sur les distributions antérieures, tout comme ils le pourraient sur toute autre donnée problématique.
Robert Dodier
2
Cela ne me dérange pas d'entrer dans une discussion sur les fondations. Ce n'est pas l'endroit approprié et mon seul point pour vous était que je pense que vous avez pris une photo bon marché et que votre réponse était inappropriée. Cela ne nécessite pas une discussion sur les fondements des statistiques.
Michael R. Chernick
4
Embrassez-vous les gars.
Brandon Bertelsen
-4

Je suis sceptique sur les statistiques pour les raisons suivantes.

  1. Je suis convaincu que quiconque sans diplôme d'études supérieures en statistique n'a aucune idée de ce qu'il fait. Unf. il y a des millions de personnes à travers le monde qui font de la recherche sans diplôme d'études supérieures en statistique. J'étais un étudiant de premier cycle en mathématiques à l'Univeristy of Maryland College, Park. J'ai pris 4 400 cours de mathématiques de niveau. Tout ce que les enseignants ont fait, c'est vous apprendre à calculer des choses. Personne ne m'a appris à donner un sens à quoi que ce soit ou à faire une analyse statistique, sauf pour les tests d'hypothèse, ce qui n'a aucun sens pour 2 raisons.
    1. Pour chaque test d'hypothèse qui m'a été enseigné, j'ai dû faire des hypothèses au préalable. Personne ne m'a appris avec quelle (s) hypothèse (s) je devais commencer. 2. Les valeurs P n'ont aucun sens logiquement. Un diplôme d'études supérieures en statistique pourrait vous apprendre ce qu'est réellement une valeur ap. Cependant, je suis convaincu qu'aucun étudiant de premier cycle ne sait comment l'utiliser. La définition de premier cycle suppose une probabilité que quelque chose dépende de l'hypothèse correcte. Logiquement, la définition n'a aucun sens. Pire encore, PERSONNE ne m'a jamais dit d'où venait la probabilité. J'ai en fait envoyé un courriel à presque tout mon département de mathématiques (plus de 200 personnes) si quelqu'un pouvait me donner une réponse. Les réponses les plus populaires et les seules étaient "il faudrait assumer les taux d'erreur pour la probabilité" (quand j'ai demandé aux gens comment cela s'était fait, ils m'ont tous répondu "
    La même chose s'est produite lorsque j'ai recherché sur Google la signification de la valeur ap. Cela m'amène à la conclusion ...

  2. Même un sig. nombre de professeurs de mathématiques et de statistiques n'ont aucune idée de la logique des statistiques. Je ne m'attends pas à ce que les gens aient une connaissance approfondie. Cependant, j'ai le sentiment que même un sig. % des chercheurs et des professeurs ne comprennent aucune des logiques sous-jacentes aux statistiques.

  3. L'erreur statistique n'est pas la même chose que l'erreur réelle. Parce que les gens aiment utiliser des statistiques pour dériver des estimations pour des choses qui sont énormes, les gens aiment utiliser l'erreur statistique pour "masquer" le fait qu'ils n'ont aucune idée de ce qu'est l'erreur réelle.

  4. Les gens utilisent de petits échantillons pour de grandes populations parce que la théorie statistique leur dit qu'ils peuvent. L'un de mes cours universitaires m'a appris que les gens aiment utiliser des données qui sont une estimation d'environ 30 écoles du pays pour montrer qu'il y a peu d'incidents violents dans les écoles de tout le pays. Il y a environ 100 000 écoles. Cela semble fou. Tout un mouvement populaire est basé sur une trentaine d'écoles dans tout le pays.

  5. Les gens aiment faire de la charge de la preuve une statistique. Le Higgs Bossom n'a jamais été découvert. Il a été découvert statistiquement, mais cela ne veut rien dire. Une découverte purement statistique est inutile car personne ne connaît l'exactitude des statistiques.

  6. Les gens aiment utiliser les statistiques pour faire des choix importants. Les statistiques peuvent être utilisées comme guide, mais personne ne sait à quel point elles sont exactes. Ce n'est pas parce qu'un problème semble impossible à résoudre que les statistiques sont la meilleure chose à faire. Le fait que les tests ADN soient basés sur des statistiques me donne des frissons. Puis-je obtenir la peine de mort uniquement à cause des statistiques? Un meurtrier pourrait-il être libéré de prison uniquement à cause des statistiques?

Je pense que les statistiques peuvent être utiles, mais seulement si elles ne sont pas utilisées comme conclusion. Je crois que les statistiques peuvent nous dire quelles sont certaines des possibilités. Ensuite, la logique, et non la logique statistique, devrait être utilisée pour prouver quelle (s) possibilité (s) est correcte.

Alexander Kao
la source
1
"... inutile parce que personne ne connaît l'exactitude des statistiques", et vos plaintes au sujet de tirer des conclusions à partir de preuves statistiques comme un échantillon d'écoles ou d'ADN, suggèrent que vous ne faites pas confiance à l'inférence statistique . Pourtant, un échantillon limité est souvent constitué de toutes les preuves disponibles ou de toutes les données que vous pouvez vous permettre de saisir. Comment peser ces preuves? Nous sommes confrontés à l'incertitude, car notre échantillon ne reflétera pas exactement l'ensemble de la population. L'inférence porte sur cette incertitude, par exemple les intervalles de confiance mesurent l'incertitude dans les statistiques d'échantillon comme la moyenne de l'échantillon (en gros, la «précision» des statistiques est connue).
Silverfish
2
"les professeurs ne comprennent aucune des logiques sous-jacentes des statistiques" - il existe des philosophies radicalement différentes de la statistique (voir par exemple le débat bayésien-fréquenciste) mais la plupart des gens sont pragmatiques quant aux techniques qu'ils appliquent à un problème particulier. Cela ne figure peut-être pas très, voire pas du tout, dans un cours de premier cycle, mais la philosophie des statistiques n'a certainement pas été élaborée au hasard sur le dos d'une enveloppe un jour. Quant aux valeurs de p, "Logiquement, la définition n'a aucun sens": vous devriez peut-être consulter cette question sur CV .
Silverfish
1
Les diatribes spéculatives ne sont pas considérées comme des réponses appropriées sur les sites SE. Ils peuvent être amusants - et peuvent contenir certaines vérités, comme je crois que celle-ci le fait - mais à la fin ils meurent de tristes morts, comme dans l'évaluation sombre de la vie de l'homme dans Macbeth, Acte V, scène 5, lignes 26-28 .
whuber