Citations statistiques célèbres

248

Quel est votre devis statistique préféré?

Ceci est un wiki de la communauté, alors veuillez faire une citation par réponse.

robin girard
la source
8
Cette question devrait-elle vraiment être "des citations célèbres sur les statistiques"?
naught101

Réponses:

248

Tous les modèles sont faux, mais certains sont utiles. (George EP Box)

Référence: Box & Draper (1987), Construction de modèles empiriques et surfaces d'intervention , Wiley, p. 424.

Voir aussi: GEP Box (1979), "Robustness in the Strategy of Scientific Model Building" dans Robustness in Statistics (Launer et Wilkinson eds.), P. 202.

Rob Hyndman
la source
3
J'utilise beaucoup cette citation pour expliquer les difficultés rencontrées par les mathématiciens lors de la transition vers les statistiques
user549 le
25
Cette phrase elle-même est un modèle (un épistémologique)
user603
6
mais voyez une belle discussion autour de cette citation sur le blog de Gelman, j.mp/9SgIBO
chl
14
Et ceci est une citation réelle, par opposition à quelque chose "attribué à" Box. Cela apparaît, par exemple, dans Box & Draper (1987), Constructions de modèles empiriques et surfaces de réponse , Wiley, page 424. Oui, je suis allé le chercher avant de l’utiliser dans un document.
Stephan Kolassa
16
Malheureusement, trop de gens l'utilisent pour s'excuser des défauts de leurs modèles. D'après mon expérience personnelle, son utilisation est un signe d'alarme.
JohnRos
206

"Une réponse approximative au bon problème vaut beaucoup plus qu'une réponse exacte à un problème approximatif." - John Tukey

John D. Cook
la source
16
J'aime celui-ci, pourrait être mis comme un conseil quand les gens écrivent des questions sur ce site?
robin girard
7
Absolument ... poser la bonne question est l’une des compétences les plus importantes.
Shane
5
Je me souviens d'une fois où une entreprise privée avait chargé un mathématicien de résoudre un problème d'acheminement du ramassage des ordures. En résumé, le mathématicien s'est plaint que la société ne souhaitait trouver qu'une solution "suffisamment proche" plutôt qu'une solution optimale. Je pense qu’en fin de compte, il a été renvoyé et qu’un chercheur en opérations a été amené à la place.
dassouki
2
@ dassouki Je pense que la citation concerne davantage la question .... quelque chose comme la science ne consiste pas à trouver une bonne réponse, mais à trouver de bonnes questions!
robin girard
13
"Mieux vaut une réponse approximative à la bonne question, souvent vague, qu'une réponse exacte à la mauvaise question, qui peut toujours être précisée." John W. Tukey 1962 L'avenir de l'analyse des données. Annals of Mathematical Statistics 33: 1-67 (voir pp. 13-14) Il a sans doute dit des choses semblables à d'autres moments, mais c'est une source précise, et la version que je vois habituellement citée.
Nick Cox
137

"Faire appel au statisticien après la fin de l'expérience n'est peut-être rien d'autre que de lui demander de procéder à un examen post mortem: il pourra peut-être dire de quoi l'expérience est morte."

- Ronald Fisher (1938)

La citation peut être lue à la page 17 de l'article.

RA Fisher. Allocution présidentielle du professeur RA Fisher, Sc.D., FRS Sankhyā: The Indian Journal of Statistics (1933-1960), vol. 4, n ° 1 (1938), pages 14-17. http://www.jstor.org/stable/40383882

inconnu
la source
J'ai lu une version légèrement différente de cette citation de Fisher: "Embaucher un médecin une fois les données collectées revient à embaucher un médecin lorsque le patient est à la morgue. Il pourra peut-être vous dire ce qui ne va pas, mais il est peu probable être capable de le réparer. "
Peter Flom
2
@ Peter était-ce vraiment "Engager un médecin après les données ..." ou un "statisticien" devrait-il être là quelque part?
Dason
3
@ Dason Vous avez raison! Quelqu'un a édité mon post, je pense
Peter Flom
125

87% des statistiques sont établies sur place

-Inconnu

Dilbert.com Dilbert.com

Henrik
la source
4
imgur.com/0dsVC.gif
JM n'est pas un statisticien
1
Et 45,8% des gens ne croient pas cette statistique
probabilitéislogique
ROFL ROFL Scott Adams me tue
Hack-R
Ha! Chaque fois que je vois une prévision contenant trop de chiffres significatifs, je pense à cette citation. "Le nombre de propriétaires de téléphones portables devrait s'élever à 4 372 138 975 d'ici 2020." Vraiment? Comme si quelqu'un pouvait prévoir mieux que 4.3B ou 4.4B.
JoeTaxpayer
121

Les statisticiens, comme les artistes, ont la mauvaise habitude de tomber amoureux de leurs modèles.

- George Box

shabbychef
la source
121

Les statistiques sont comme des bikinis. Ce qu'ils révèlent est suggestif, mais ce qu'ils cachent est vital.

-Aaron Levenstein

jilles de wit
la source
10
Et la vie est plus amusante sans eux? Je suppose que vous ne pouvez prendre qu'une métaphore jusqu'à présent ...
naught101
Ceci est juste devenu ma citation préférée
Ali Turab Lotia
Cela peut être? fr.wikiquote.org/wiki/Statistics phrasé légèrement différent cependant. Si vous citez tout le devis sur Google, je ne suis pas le seul à l’utiliser, mais pas de source.
jilles de wit
116

Nous croyons en Dieu. Tous les autres doivent apporter des données.

(W. Edwards Deming)

Harvey Motulsky
la source
64
Dieu doit aussi apporter des données.
Kalel
9
Dieu peut créer des données.
Leo
6
@Leo Quelles données avez-vous pour étayer cette hypothèse? :)
probabilislogic
2
Ooh, est-ce une nouvelle version du paradoxe Omnipotence? Si dieu composait de nouvelles données, comment pourriez-vous prouver qu'il n'était pas là depuis le début?
naught101
5
C'est axiomatiquement vrai.
Abaumann
105

La prévision est très difficile, surtout pour l'avenir.

- Niels Bohr

Meh
la source
18
La prédiction sur le passé peut aussi être étonnamment délicate!
walkytalky
4
Celui - ci a été attribuée à beaucoup de personnes différentes larry.denenberg.com/predictions.html et il est contesté qu'il serait Niels Bohr en.wikiquote.org/wiki/Niels_Bohr
Gerrit
101

Toutes les généralisations sont fausses, y compris celle-ci.

Mark Twain

al3xa
la source
C'est génial!
probabilitéislogique
C’est vrai, sauf qu’il existe des généralisations entièrement vraies?
naught101
1
@ naught101 Les définitions et les lois de la nature (une fois que nous les connaissons) sont des généralisations que je considère vraies. Bien que les premières ne soient pas très intéressantes, toutes les "vraies généralisations" sont vraies.
Ziggystar
95

Si vous torturez suffisamment les données, la nature vous avouera toujours.

- Ronald Coase (cité dans Coase, RH 1982. Comment les économistes devraient-ils choisir? American Enterprise Institute, Washington, DC). Je pense que la plupart des personnes qui entendent cette citation comprennent mal son message profond contre le dragage des données.

shabbychef
la source
1
Oui, votre explication est hautement nécessaire. J'imagine que beaucoup enlèveraient le sens opposé de la citation. Remarquez-moi, même la torture des idées est un mal.
Aditya
91

Un gros ordinateur, un algorithme complexe et long ne sont pas synonymes de science.

- Robert Gentleman

Paolo
la source
50
Cela semble quand même prometteur.
3
Juste curieux, où a-t-il dit / écrit cela?
Hack-R
88

La pensée statistique constituera un jour aussi une qualification nécessaire pour une citoyenneté efficace que la capacité de lire et d’écrire.

--HG Wells

Michael Bishop
la source
Par Dieu, il avait raison!
Kalel
12
Je ne sais pas, vous avez vu beaucoup de citoyens efficaces récemment?
Raskolnikov
2
J'attends toujours ...
naught101
1
Un utilisateur anonyme a demandé une source pour ce "devis"; il / elle a également indiqué que Gigerenzer avait indiqué qu’il avait cherché en vain la sortie publiée de Wells.
chl
84

La combinaison de certaines données et d’un désir ardent de réponse ne garantit pas qu’une réponse raisonnable puisse être extraite d’un ensemble de données donné.

Tukey

robin girard
la source
5
En tant que biologiste, je me retrouve à marmonner cela pendant de nombreux séminaires ...
N Brouwer
Cela devrait être enseigné dans les écoles de gestion bien avant le chapitre sur le calcul des indicateurs de performance
clés
83

Il n'y a pas de questions statistiques de routine, seulement des routines statistiques discutables.

DR Cox

Tzippy
la source
3
Rolf Sundberg a attribué cette citation à JM Hammersley dans un article de 1994: dx.doi.org/10.1016/0169-7439(93)E0041-2
onestop
1
Ce qui suit est une tentative de montage par un utilisateur anonyme: "Commentaire: On raconte après la copie que j'ai attribué cette citation (excellente) à Hammersley. La raison de mon attribution à Hammersley était que j'avais demandé à David Cox avant de l'utiliser. la citation, et il a répondu que ce n’était pas à l’origine, mais le phrasé de Hammersley. Rolf Sundberg ".
gung
C'est faux - des preuves? - t test et valeurs p! calculs de routine effectués tout le temps. Bien sûr, cela peut être "discutable" mais c'est quand même une routine!
probabilitéislogique
76

Statistiques - Un sujet que la plupart des statisticiens trouvent difficile, mais sur lequel de nombreux médecins sont des experts. "Stephen S. Senn"

Kieran
la source
3
Crédit: Stephen Senn, Questions statistiques sur le développement des médicaments , page 4. media.wiley.com/product_data/excerpt/71/04700187/0470018771.pdf
onestop
2
Je pense que c'est parce que la physique a un niveau similaire de pédantisme requis pour les statistiques, et que le physicien a le grand avantage de vouloir se débarrasser de l'incertitude, le statisticien veut juste la décrire.
probabilitéislogique
26
Physicians \ neq physicists
David Roberts
1
C'est peut-être mon nouveau favori
Fomite
1
Bien que je puisse imaginer que cela s’applique aussi aux physiciens.
WetlabStudent
75

Les événements étranges se permettent le luxe de se produire.

- Charlie Chan

ars
la source
14
Le vote négatif ne me dérange pas, mais je maintiens qu’il s’agit d’un argument statistique important, à ne pas prendre à la légère. ;-)
ars
Surtout si vous êtes dans le secteur des services financiers.
DWin
2
Je dirais que la clé pour déchiffrer le sens de cette citation est de reconnaître que le mot "étrange" est relatif à ce que votre modèle de "normal" est.
probabilityislogic
1
Est-ce simplement une façon verbeuse de dire "les valeurs aberrantes se produisent", ou y a-t-il quelque chose de plus profond qui me manque?
naught107
Une citation similaire que j'aime bien est la suivante: «Avec un assez grand échantillon, toute chose scandaleuse est susceptible de se produire» (Persi Diaconis et Frederick Mosteller).
MattBagg
75

Une belle je suis venu sur:

Je pense que c'est beaucoup plus intéressant de vivre sans savoir que d'avoir des réponses qui pourraient être fausses.

Par Richard Feynman ( lien )

Tal Galili
la source
Si j'étais un homme de paris, je dirais que Richard Feynman était un agnostique
probabislogique
1
Feynman est-il qualifié de statisticien?
Glen_b
Sympa mais Thomas Gray le dit mieux "Où l'ignorance est un bonheur, c'est une folie d'être sage."
Marco Stamazza
@Glen_b En fait, la question est "Quel est votre devis statistique préféré?" non "Quelle est votre citation préférée d'un staticien?"
machine le
Autant que je sache, l'intention de la citation n'est pas statistique non plus.
Glen_b
70

Il utilise les statistiques comme un homme ivre utilise un lampadaire, plus comme support que comme illumination.

- Andrew Lang

Neil McGuigan
la source
67

La meilleure chose à propos d'être statisticien, c'est que vous jouez dans la cour de tous.

- John Tukey

(Ceci est ma citation préférée de Tukey)

shabbychef
la source
4
J'adore celui-ci - un formidable atout d'être statisticien.
Kingsford Jones
Je ne sais pas ce que cela signifie. Est-ce parce que les statistiques s'appliquent à presque tous les domaines?
Ali Turab Lotia
@ Ali, je crois que c'est l'intention générale. Les statistiques peuvent constituer un cadre épistémologique très puissant qui a été utilisé dans de multiples domaines comportant des systèmes extrêmement complexes (biologie, économie, épidémiologie, climatologie, etc.).
Ashe
C’est précisément pour ça que je suis arrivé sur le terrain, je suis curieux!
Adunaic
63

L'absence de preuve n'est pas une preuve d'absence.

- Martin Rees ( Wikipedia )

Jonik
la source
67
Bonne citation, mais ce n'est pas vrai! L'absence de preuve n'est pas une preuve d'absence, mais c'est certainement une preuve . Pourquoi pensons-nous que les monopoles magnétiques (ou les licornes, d'ailleurs) n'existent pas? Parce que nous avons cherché et n’en avons trouvé aucun.
John D. Cook
13
En outre, Tzippy crie mal Sagan, puisque Sagan n’a jamais cru cela. En fait, il l'a classée parmi les idées fausses contenues dans son kit de détection baloney .
Raskolnikov
7
@ JohnD.Cook, +1. Cependant, votre commentaire s'appuie sur le fait que nous avons examiné et qu'il y avait une chance raisonnable d'avoir trouvé des preuves si elles existaient réellement; considérons, par exemple, les divers «chaînons manquants» qui ont finalement été trouvés (et ceux qui ne l’ont pas encore été).
gung
1
Wikipedia semble créditer Martin Rees ... qui n’est pas non plus un statisticien.
Glen_b
1
@Glen_b Il semble que Sagan aurait pu dire que, d'une certaine manière, ironique, si tout se passe bien, il critique la citation de Martin. C’est quelque chose à envisager, pour moi, car la cosmologie regorge d’exemples où des prédictions ont été faites pour rendre compte de sources inexplicables d’erreur qui se sont avérées correctes (ou pas assez discrètes), par exemple le rayonnement de fond cosmique, la matière noire, etc. la théorie du Big Bang.
AdamO
54

Supposons que vous vous teniez debout avec un pied dans le four et un pied dans un seau à glace. Selon le pourcentage de personnes, vous devriez être parfaitement à l'aise.

-Bobby Bragan, 1963

Albort
la source
8
Mauvais: 200 C et 0 C en moyenne à environ 100 C, qui est le point d'ébullition de l'eau. Les fours ne descendent qu'à environ 150 ° C et il fait encore trop chaud. Maintenant, si vous avez un pied dans l’eau bouillante (environ 55 ° C) et un autre dans de l’eau froide et glacée ... alors vous êtes probablement une personne étrange.
alexfernandez
1
Double faux. La glace peut raisonnablement être à des températures plus basses.
Firebug
1
@alexfernandez Mon four commence à 50 ° C. C'est un four standard et tous les fours des appartements dans lesquels je vivais ont commencé à cette température.
Ce que je suppose, c'est que la cuisson à basse température a fait baisser les températures minimales, mais je doute que cela ait été le cas en 1963.
alexfernandez
Je traduirais un idiome russe similaire par "La température moyenne des patients à l'hôpital est normale".
Eduard Gelman
52

"Il est facile de mentir avec des statistiques; il est plus facile de mentir sans elles."

- Frederick Mosteller

Buckminster
la source
51

M. Lippmann, car les expérimentateurs s'imaginent que c'est un théorème de mathématiques, et les mathématiciens que c'est un fait expérimental.

Henri Poincaré, Calcul des probabilités (2e éd., 1912), p. 171.

En anglais:

Tout le monde croit à la loi exponentielle des erreurs [ c. -à-d. La distribution normale]: les expérimentateurs, parce qu'ils pensent que cela peut être prouvé par les mathématiques; et les mathématiciens, parce qu'ils croient que cela a été établi par l'observation.

Whittaker, ET et Robinson, G. "Distribution de fréquence normale". Ch. 8 dans Le calcul des observations: Traité de mathématiques numériques , 4e éd. New York: Dover, pp. 164-208, 1967. p. 179.

Cité à Mathworld.com .

gain
la source
8
C’est une traduction assez libre d’un dicton attribué à Gabriel Lippmann par Henri Poincaré dans son Calcul des probabilités (1896/1912). L'original était en français, naturellement. Lippmann a reçu le prix Nobel de physique en 1908.
Nick Cox
46

Ma plus grande préoccupation était de savoir comment l'appeler. J'ai pensé l'appeler 'information', mais le mot a été trop utilisé, alors j'ai décidé de l'appeler 'incertitude'. Lorsque j'en ai discuté avec John von Neumann, il avait une meilleure idée. Von Neumann m'a dit: «Vous devriez appeler cela de l'entropie, pour deux raisons. En premier lieu, votre fonction d’incertitude a été utilisée en mécanique statistique sous ce nom; elle a donc déjà un nom. En second lieu, et plus important encore, personne ne sait vraiment ce qu'est vraiment l'entropie, alors dans un débat, vous aurez toujours l'avantage.

Claude Elwood Shannon

robin girard
la source
46

Je ne sais pas à propos de célèbre, mais ce qui suit est l'un de mes favoris:

Effectuer une analyse de données, c'est comme boire un bon vin. Il est important de remuer et de renifler le vin, de décompresser le bouquet complexe et d’apprécier l’expérience. Gulping le vin ne fonctionne pas.

-Daniel B. Wright (2003), voir PDF de l'article .

Référence : Wright, DB (2003). Se lier d'amitié avec vos données: améliorer la manière dont les statistiques sont conduites et rapportées1. British Journal of Educational Psychology, 73 (1), 123-136.

Jeromy Anglim
la source
J'aime ça, même si ça me rappelle en.wikipedia.org/wiki/Swiss_Toni
onestop le
45

Tout ce que nous savons sur le monde nous enseigne que les effets de A et B sont toujours différents - à une décimale près - pour tout A et B. Ainsi, demandant "les effets sont-ils différents?" est stupide.

Tukey (encore mais celui-ci est mon préféré)

robin girard
la source
Cela a en fait conduit à des articles très intéressants ... :)
Tal Galili
@Tal: Entièrement d'accord! Je pense que tout le domaine de la séparation optimale dans les tests minimax part de cette idée ... et il est encore si confus pour beaucoup de statisticiens. Pour ceux qui sont intéressés, voir le papier de donoho projecteuclid.org/… (et les références dans le papier! Les choses sont beaucoup plus anciennes que le papier de donoho)
robin girard Le
45

... sûrement, Dieu aime le 0,06 presque autant que le 0,05. Peut-il y avoir un doute sur le fait que Dieu considère la force de la preuve pour ou contre le nul comme une fonction assez continue de la magnitude de p? (p.1277)

Rosnow, RL et Rosenthal, R. (1989). Procédures statistiques et justification des connaissances en sciences psychologiques. American Psychologist, 44 (10), 1276-1284. pdf

Henrik
la source
J'aimerais prendre celui-ci comme ma réponse acceptée! trop beau pour être vrai !
robin girard
Quoi qu'il en soit, je peux citer Lehman à ce sujet: "Cette normalisation présente un certain avantage, car elle permet de réduire certains tableaux nécessaires à la réalisation de divers tests".
robin girard
Rosnow & Rosenthal's est une citation très utile et révélatrice qui est presque correcte.
rolando2
1
@ rolando2: veuillez agrandir. Qu'est-ce qui ne va pas?
naught101
@ naught101 - À ce stade, je ne peux penser à rien :-)
rolando2
44

[À deux reprises, des députés] m'ont demandé: "Priez, Monsieur Babbage, si vous mettez dans la machine des chiffres erronés, les bonnes réponses seront-elles données?" Je ne suis pas en mesure d'appréhender correctement le type de confusion d'idées susceptible de provoquer une telle question.

Charles Babbage

Frank Zafka
la source
3
+1 Un signe à couper le souffle des folies du siècle à venir; "GIGO avant l'heure."
whuber
merde=merde
3
Est-ce que vous plaisantez? N'est-ce pas ce que l'économie est tout au sujet?
naught101
1
si je tape "stick axchange crss vlidated" dans Google, cela m'amène ici!
Neil McGuigan
2
J'ai eu l'occasion d'utiliser la merveilleuse deuxième phrase de Babbage dans un plus grand nombre de situations.
Glen_b
40

Le subjectiviste (c'est-à-dire bayésien) formule ses jugements, tandis que l'objectiviste les passe sous le tapis en invoquant la connaissance des suppositions, et il jouit de la glorieuse objectivité de la science.

IJ Bon

ramhiser
la source
oh le bayésien est tellement bon ...
robin girard
J'aime celui la. C'est super !
steffen
Pourquoi le bayésien est-il toujours assimilé au subjectiviste? - Qu'en est-il d'ETJaynes et de l'autre «objectif bayésien»? Qu'en est-il de toute subjectivité dans le fréquentisme «objectiviste»?
gwr
2
@gwr Well 'l'objectivité' est une construction sociale évaluée subjectivement comme une expérience. Par conséquent, appeler les Bayésiens sur la subjectivité est moins méritoire parce que faux et plus méritoire parce que plus ou moins tout le monde est subjectiviste. ;)
Alexis
40

Ne vous fiez pas aux statistiques que vous ne vous êtes pas faussées.

-- Winston Churchill

shabbychef
la source
6
Cette citation semble être connue uniquement en Allemagne et il est douteux qu'elle soit authentique, voir le lien ci-dessous où l'Office national de la statistique du Bade-Wurtemberg présente les résultats de ses recherches sur cette citation (malheureusement, il n'est disponible qu'en allemand). Le Times, par exemple, a déclaré ne jamais en avoir entendu parler. statistik.baden-wuerttemberg.de/Veroeffentl/Monatshefte/…
psj
4
La forme alternative est "Je ne crois que dans les statistiques que je me suis maquillé", prétend parfois avoir été confié à Churchill par Goebbels au cours d'une dispute de propagande sur les pertes subies pendant la guerre.
Henry
J'avoue que je n'ai pas enquêté sur l'origine de la citation. Cependant, l'essentiel de la déclaration reste vrai. Les statistiques, en particulier dans les médias, ne reçoivent jamais les informations nécessaires pour estimer leur validité ou leur exactitude.
ymihere
2
Churchill est-il qualifié de statisticien?
Glen_b
1
@Glen_b S'il a déjà simulé des données, alors bien sûr!
Darren Cook