Quel est le livre le plus influent que chaque statisticien devrait lire?

77

Si vous pouviez remonter dans le temps et vous dire de lire un livre spécifique au début de votre carrière de statisticien, de quel livre s'agirait-il?

Neil McGuigan
la source
1
Il y a vraiment trois questions distinctes ici! 1) Quel est le livre le plus influent en statistique? 2) Quel livre chaque statisticien devrait-il lire? 3) Quel livre avez-vous lu que vous souhaiteriez le plus lire beaucoup plus tôt. (2) et (3) ont probablement des chevauchements considérables; (1) peut être très distinct.
onestop
1
Cette question est une autre façon de regarder cette question. J'espère que cela fournira un bon complément, une fois qu'il aura de bonnes réponses.
naught101

Réponses:

38

En voici deux à mettre sur la liste:

Tufte. L'affichage visuel d'informations quantitatives
Tukey. L'analyse exploratoire des données

Rob Hyndman
la source
10
Les deux méritent une relecture périodique, peut-être une fois par décennie, pour rafraîchir les idées. À propos de Tukey: c'est bien de s'asseoir de temps en temps avec un crayon et du papier et d'analyser en profondeur un ensemble de données intéressant.
whuber
6
Pour les graphismes d'un statisticien, je préfère les livres de William Cleveland à ceux de Tufte.
Peter Flom - Rétablir Monica
1
J'ai l'impression que ces livres étaient destinés à analyser des données non linéaires alors que les méthodes non linéaires n'étaient pas aussi disponibles?
Robert Kubrick
34

Les éléments d'apprentissage statistique de Hastie, Tibshirani et Friedman http://www-stat.stanford.edu/~tibs/ElemStatLearn/ devraient figurer dans la bibliothèque de tout statisticien!

robin girard
la source
6
Je ne suis pas d’accord - il s’agit d’un lien étroit avec l’apprentissage automatique, pas de statistiques en soi !
aL3xa
@ aL3xa: il est certainement axé sur l'apprentissage automatique ... c'est pourquoi je pense que les statisticiens devraient y être exposés tôt.
Cliff AB le
Apparemment, je suis dans la minorité en pensant que ce livre est surestimé. Cela semble être écrit pour un étudiant de troisième cycle, mais un étudiant qui ne se soucie pas des détails de la façon dont tout fonctionne.
Le laconique
25

Je ne suis pas statisticien et je n'ai pas beaucoup lu sur le sujet, mais peut-être

Lady Tasting Tea: Comment les statistiques ont révolutionné la science au vingtième siècle

devrait être mentionné? Ce n'est pas un manuel, mais mérite d'être lu.

Vivi
la source
1
Je seconde ceci. En outre, il y a beaucoup de suggestions de lectures supplémentaires qui, à mon avis, sont utiles dans le livre.
Chris Beeley
1
Je pense que ce livre s'adresse à ceux qui ne savaient rien au début, mais l'obturation de la langue et le bagage culturel associé au domaine. Ce livre a donné des ailes à l'esprit - il dit que les statistiques consistent à trouver la vérité utile dans un océan de bruits et de malentendus.
EngrStudent
2
Beaucoup de gens ont rapporté que c'était amusant, mais c'est une série d'erreurs extraordinaires. Si vous pouvez le trouver, mon compte rendu dans Biometrics 57: 1273-1274 (2001) en donne une liste loin d’être complète. (Salsburg mélange divers Bernoullis, ce qui est plus facile à faire.)
Nick Cox
21

Théorie des probabilités: la logique de la science

Christopher D. Long
la source
Ce livre est difficile. Il s'agit des fondements de la probabilité, et même dans cette partie de la statistique, je ne pense pas que ce soit un texte de référence. Je pense qu'il est possible que 14 personnes sur la planète Terre lisent et comprennent son message dans son intégralité, mais je dirais que c'est probablement une lecture incontournable pour les probabilistes, pour le bien-être de milliers d'autres qui sont profondément ancrés dans des choses comme les GLM, les GAM, Modèles bayésiens et autres choses.
signifie-à-sens
1
Il est également un peu triste que certains des chapitres ultérieurs soient manquants et / ou sous-développés - par exemple, il n'y a pas de chapitre sur la régression, mais un projet de manuscrit non publié était disponible avec des informations fascinantes sur les régressions "d'erreur de mesure". Quelques trucs vraiment cool sur les séries chronologiques cependant.
probabilityislogic
21

Darrell Huff - Comment mentir avec les statistiques

Rob Hyndman
la source
5
À l'époque où il s'agissait d'un livre de poche à 3,95 $ , puis à 4,95 $ , j'ai acheté des exemplaires par douzaine et les ai donnés à des amis, des clients et à quiconque pourrait être intéressé.
whuber
On s'en souvient à juste titre. Mais le contenu non statistique le date malheureusement, et notamment une fraction extrêmement importante de dessins animés mettant en scène des personnes (et même des bébés) qui fument. Plus de 60 ans, ce n'est plus amusant. (Certains réimpressions, par exemple un au Royaume-Uni, ont mis à jour les caricatures.)
Nick Cox
14

Ce n'est pas un livre, mais j'ai récemment découvert un article de Jacob Cohen dans American Psychologist intitulé "Ce que j'ai appris (jusqu'à présent)". Il est disponible en pdf ici .

Freya Harrison
la source
C’est un article merveilleux, écrit dans le style lucide et conversationnel de Cohen.
richiemorrisroe
12

Il y a bien longtemps, la petite monographie de Jack Kiefer "Introduction à l'inférence statistique" a dévoilé le mystère de nombreuses statistiques classiques et m'a aidé à commencer avec le reste de la littérature. J'y fais toujours référence et le recommande vivement aux étudiants les plus solides qui suivent les cours de statistiques de deuxième année.

Rob Hyndman
la source
2
Excellente recommandation, merci - j'ai récemment reçu un exemplaire basé sur cela et c'est vraiment très bon.
ars
1
Je suis heureux d'entendre que quelqu'un d'autre apprécie ce livre!
whuber
12

Je ne dirais pas que l'un ou l'autre devrait être considéré comme "le livre le plus influent ... pour les statisticiens [s]", mais pour ceux qui commencent tout juste à en apprendre davantage sur le sujet, deux livres utiles sont:

  1. Robert Abelson, La statistique comme argument de principe
  2. Paul Murrell, Introduction aux technologies de données
gung - Rétablir Monica
la source
Abelson serait également utile à beaucoup de ceux qui ne font pas que commencer.
Peter Flom - Rétablir Monica
11

Le livre de William Cleveland "The Elements of Graphing Data" ou son livre "Visualizing Data"

Robert Alberts
la source
1
Je lis actuellement The Elements (Visualizing Data ne se trouve pas dans la bibliothèque de mon école actuelle). Quelle est la différence entre les éléments et la visualisation des données? Je n'ai pas été en mesure de trouver suffisamment de descriptions détaillées pour formuler exactement la différence entre les deux.
Andy W
2
Je suis d'accord. Je pense que, pour les statisticiens, Cleveland est meilleur que Tufte.
Peter Flom - Rétablir Monica
3
+1 à Robert Alberts, et +1 à Peter Flom (les livres de Cleveland sont certainement meilleurs pour les statisticiens, bien que ceux de Tufte soient beaux aussi, et je les ai tous lus). @AndyW, Elements est une introduction, par exemple, il contient des instructions pour créer un graphique informatif. La visualisation montre comment centrer votre processus d'exploration de données sur des graphiques; il commence par une visualisation préliminaire des données, aborde les problèmes actuels et évalue ensuite le modèle final (par exemple, l'analyse résiduelle) via des graphiques. Ce dernier est beaucoup plus informatif que le premier.
Gay - Rétablir Monica
@AndyW L'un d'eux est un peu plus technique que l'autre (j'oublie ce qui est pourtant!)
Peter Flom - Réintégrer Monica
1
Comme @gung le dit, la visualisation est une suite plus avancée d’ éléments . Il y a un certain chevauchement, mais c'est utile plutôt que irritant. Les deux fortement recommandé. La dernière révision date de 1993 et ​​1994, mais ils sont encore frais 20 ans plus tard. Notez que les lecteurs non techniques tireraient profit des deux: je peux personnellement garantir que les mathématiques au lycée sont suffisantes.
Nick Cox
6

Côté mathématiques / fondements: les méthodes mathématiques de statistique de Harald Cramér .

ars
la source
À propos, c'est le premier endroit où j'ai trouvé la mention du phi de Cramer. C'est incroyable de voir comment une belle petite sidenote dans ce livre est devenue une méthode bien connue plusieurs décennies plus tard.
Tal Galili
5

Pour une présentation claire de ce qui devrait figurer dans les articles de revues de sciences sociales (aide si vous écrivez ou évaluez par des pairs), j’aime le Guide du réviseur sur les méthodes quantitatives en sciences sociales . En particulier, j’aime la table desideratra comme un résumé du minimum qu’un article (article, thèse, mémoire) doit contenir. Les chapitres sont séparés par une technique d'analyse, ce qui est agréable. Je pense que le livre a des applications plus larges que "uniquement" les sciences sociales, car les techniques abordées sont utilisées dans de nombreux domaines.

Très tôt, alors que la question ne couvrait peut-être pas, j'ai été présenté à Introduction aux méthodes statistiques et à l'analyse des données d' Ott par Ott . C'est assez cher, mais c'est une ressource merveilleuse pour montrer les modèles statistiques sous-jacents pour diverses méthodes de GLM. Je rêve du jour où les revues exigent que les articles contiennent la formule du modèle statistique testé.

Pour vérifier les hypothèses de test, examiner les effets de différentes options au sein d’un test, etc., c’est le livre que j’aurais aimé avoir pendant mes études . J'ai l'édition précédente et c'est l'une des meilleures ressources générales que j'ai achetées en raison de la manière claire et cohérente dont les informations sur les tests sont présentées. Il contient de beaux exemples illustrant le (s) test (s) et n'exige pas du lecteur qu'il dispose d'un logiciel de statistiques particulier pour pouvoir suivre les expositions.

Michelle
la source
4

Trompé par le hasard par Taleb

Taleb est professeur à Columbia et négociateur d'options. Il a gagné environ 800 millions de dollars en 2008 en pariant contre le marché. Il a également écrit Black Swan. Il discute de l'absurdité d'utiliser la distribution normale pour modéliser des marchés et philosophe sur notre capacité à utiliser l'induction.

Neil McGuigan
la source
8
Un livre terrible, écrit par quelqu'un qui ne comprend pas les statistiques ...
Xi'an
4
Xi'an, souhaitez-vous développer ou fournir des liens vers certaines critiques?
naught101
4
Il y a beaucoup de commentaires sur Le Cygne Noir (et plus généralement Taleb) ici
Peter Flom - Réintégrer Monica
4

J'ai lu les recommandations ci-dessus et j'ai été surpris de constater que la plupart des personnes qui ont répondu à la question étaient des personnes qui n'étaient pas des statisticiens. À deux ou trois exceptions près ... En tant que statisticien industriel qui travaillait également avec des spécialistes des sciences sociales et des professionnels de la santé, je dirais que si je ne pouvais emporter qu'un seul livre sur une île déserte, ce serait George EP Box, Statistics for Experimenters. (Wiley) Dans son style humoristique et lucide inimitable, il explique l'essence et la philosophie de la construction de modèles mathématiques pour des données réelles. La pensée rigoureuse, pas de frivolités mathématiques, pas de bêtises, nous apprend à penser statistiquement, à tracer et à visualiser tout ce que vous pouvez. Un chef-d'œuvre d'un scientifique appliqué compétent (ingénieur chimiste devenu statisticien). Toujours amusant de relire.

jh
la source
2
Bon choix! Son co-auteur, le regretté William Hunter et J. Stuart Hunter, a également contribué au livre.
Michael Chernick
La première édition est plus propre et plus fraîche que la seconde. Box était un excellent statisticien mais, plus tard, un médiocre relecteur.
Nick Cox le
3

Beaucoup de bons livres déjà suggérés. Mais en voici un autre: "Reckoning With Risk" de Gerd Gigerenzer, car il est plus important de comprendre comment les statistiques affectent les décisions que de bien comprendre toutes les théories. En fait, le péché numéro un des statisticiens ne parvient pas à communiquer clairement. Son livre parle des conséquences d'une mauvaise communication et des moyens de l'éviter.

noir mat
la source
"Comprendre comment les statistiques affectent les décisions est plus important que de bien comprendre toute la théorie ..." N'est-ce pas la vérité? Je viens d'un contexte d'architecture, et je peux vous dire que, parfois, la théorie ne fait que
gêner
2

Je vais aller de l'avant et proposer un manuel standard sur le terrain. Je parle de Probabilité et Statistiques de Degroot et Schervish, publiées pour la première fois en 1975.

Ce livre a servi de manuel à de nombreux étudiants et est considéré comme un classique, à juste titre, à mon avis. Il couvre des sujets tels que la combinatoire, les distributions, les statistiques bayésiennes, l'inférence de vraisemblance et l'analyse de régression. Pour autant que je sache, aucun autre manuel n’est aussi complet, je pense donc que c’est un must.

JohnK
la source
1

Le guide essentiel sur la taille des effets: puissance statistique, méta-analyse et interprétation des résultats de recherche par Paul D. Ellis

Ce livre est un "must" pour tous ceux qui mènent des recherches scientifiques, en particulier celles qui ne proviennent pas uniquement de statistiques / mathématiques. Le livre ci-dessous étend le premier concernant les intervalles de confiance.

Comprendre les nouvelles statistiques: tailles d'effet, intervalles de confiance et méta-analyse par Geoff Cumming

Adam Przedniczek
la source
1

"Le plus influent" est une notion très différente de "tout le monde devrait lire". Je ne suis pas qualifié pour répondre à la première question - vous auriez besoin d'un historien des statistiques - mais pour la seconde, en voici quelques-unes:

  1. Les statistiques en tant qu'argument de principe de Robert Abelson devraient être lues par tous ceux qui utilisent ou utilisent des statistiques pour la science, les sciences humaines, etc.

  2. Les deux livres de William S. Cleveland sur les graphiques: Les éléments de données graphiques et Visualizing Data . Pour les statisticiens, je les mettrais même avant le travail de Tufte, parce que Tufte n’en valait pas la peine, mais parce que a) Cleveland écrivait avec les statisticiens comme son public cible et b) Cleveland avait fondé ses recommandations sur des données expérimentales sur la façon dont les gens percevaient les graphiques, plutôt que de l'intuition.

  3. Analyse exploratoire des données par John Tukey. C'est daté mais précieux - vous pouvez faire beaucoup avec un crayon, du papier et un cerveau (du moins, si votre cerveau est aussi bon que celui de Tukey!)

Peter Flom - Réintégrer Monica
la source
1

Ce serait probablement l'analyse de données bayésienne par Gelman ou Deep Learning with Python . Mais c'est un peu comme prendre la streptomycine au moyen âge. Celles-ci n'avaient pas été écrites au début de ma carrière et de nombreuses choses dans les livres auraient été une grande nouvelle à l'époque. Certaines des choses les plus influentes que tout le monde devrait savoir ne se trouvent cependant pas dans une source unique (elles devraient peut-être l'être, mais ...).

Björn
la source
0

Le Guide de l'économétrie de Kennedy contient une mine de conseils pratiques sur un large éventail d'analyses statistiques. C'est à la fois incroyablement dense en informations et facile à lire, et j'apprends toujours quelque chose de nouveau chaque fois que je le prends.

L’ introduction à l’économétrie de Wooldridge présente également de nombreux éléments de ce type, mais en tant que manuel d’introduction, il est plus autonome. J'aurais aimé avoir un cours basé sur ça.

Le laconique
la source