Existe-t-il un bon livre de vulgarisation scientifique sur les statistiques ou l'apprentissage automatique?

40

Il existe de très bons livres de vulgarisation sur la science, traitant de la science réelle, ainsi que de l'histoire et des raisons des théories actuelles, tout en restant extrêmement agréable à lire. Par exemple, "Chaos" de James Gleick (chaos, fractales, non-linéarité), "Une brève histoire du temps" de Stephen Hawking (physique, origine de l'univers, temps, trous noirs) ou "The Selfish Gene" de Richard Dawkins. (évolution et sélection naturelle). Certains de ces livres présentent des arguments (Dawkins) et d'autres non (Gleick). Mais ils servent tous à faciliter la compréhension des concepts autrement difficiles pour ceux d'entre nous qui ne possèdent pas de formation scientifique approfondie.

Existe-t-il de tels livres qui se concentrent principalement sur les statistiques ou l'apprentissage automatique?

Veuillez inclure un résumé de ce que couvre chaque livre.

nul101
la source
J'avais tellement d'audace d'ajouter ML au titre, car les statistiques et ML sont les deux sujets de premier niveau de ce site. Sinon, on pourrait être tenté de poser la même question pour ML. J'espère que ça va.
Steffen
2
(+1) Tout en lisant un tel livre sur des sujets que je sais parfois… énerve, il est clairement utile d’avoir une vision extérieure et, espérons-le, des idées pour expliquer des concepts difficiles aux non-initiés.
steffen
@steffen: oui, je me demandais si je devrais inclure cela. Franchement, ML ne m'intéresse pas pour le moment, mais j’imaginais que les réponses incluraient des ouvrages sur le ML, car d’un point de vue de la science populaire, ML et les statistiques sont fondamentalement la même chose. Quoi qu'il en soit, heureux de l'inclure, car il pourrait obtenir quelques livres de plus, et la duplication est inutile :)
naught101
@ naught101 Pourquoi ne pas en faire un wiki de communauté?
Momo
@Momo: heureux que cela se produise. Je ne peux pas le faire moi-même.
naught101

Réponses:

18

Je soupçonne que The Lady Tasting Tea de David Salsberg est exactement ce que vous voulez. C'est très écrit dans un style narratif, presque comme un roman, avec essentiellement pas de maths (si je me souviens bien), donc il serait accessible à tout le monde. Je l'ai lu il y a longtemps et j'ai vraiment apprécié. Il lit très vite et pourrait donner aux gens une idée de ce qu’est l’analyse statistique et comment elle peut nous aider à comprendre le monde et à résoudre des problèmes pratiques.

gung - Rétablir Monica
la source
Oui, la narration est vraiment importante. J'allais l'inclure dans la question, mais certains des exemples que j'ai utilisés n'ont pas un excellent récit (par exemple, Dawkins) et j'ai oublié.
naught101
3
Je viens de finir de lire ceci, et c’était exactement ce que je cherchais, alors merci pour la recommandation. J'ai trouvé l'écriture assez médiocre, ce qui était assez dérangeant au début, mais je m'y suis habitué après un certain temps. Le matériel traité est excellent et donne un excellent récit historique de l'origine des statistiques, des raisons qui ont motivé les découvertes, et vous laisse entrevoir ce qui reste à venir et vous donner une idée des possibilités excitantes d'obtenir plus impliqué dans le domaine. Pourrait voir si je peux obtenir la lecture de certains de mes amis
haïsseurs de stats
12

Le nouveau livre de Nate Silver, Le signal et le bruit: pourquoi la plupart des prédictions échouent - mais certaines ne correspondent pas tout à fait à votre description. C'est aussi une introduction à la pensée bayésienne pour les laïcs. Il a suscité un peu d'attention récemment et une critique du livre peut être trouvée ici .

Les livres Freakonomics de Levitt & Dubner valent également la peine d'être visités .

Momo
la source
8

Plus de bonnes lectures:

La faille des moyennes de Sam L. Savage

Trompé par le hasard par Nassim Taleb

Les deux sont des livres un peu prudents sur la manière d'interpréter les probabilités et les statistiques dans notre vie quotidienne. Par exemple, sur les marchés financiers, on pourrait utiliser à mauvais escient une distribution gaussienne quotidienne comme mesure de risque aux conséquences désastreuses. Dans ce cas, nous voudrions peut-être utiliser davantage de modèles empiriques (tels que les simulations de monte carlo). Taleb est très populaire dans les milieux financiers et nous met souvent en garde de faire plus attention aux biais comportementaux et de s’appuyer excessivement sur la modélisation.

pat
la source
8

"La théorie qui ne mourrait pas" de Sharon Bertsch McGrayne est un livre très lisible sur l’histoire de la statistique bayésienne et l’idée générale qui le sous-tend sans s’enliser dans les calculs.

Je suis également un fan du "Guide de statistiques sur les dessins animés" de Gonnick et Smith, une introduction intéressante au concept général de la statistique avec quelques calculs mathématiques, mais présenté de manière à ne pas vous endormir (j'ai aussi le guides de dessins animés sur la génétique, la physique et la chimie et ont lu quelques-unes des autres).

Greg Snow
la source
6

Je suggérerais les livres suivants, même si aucun n’est idéal, vous devriez jeter un coup d’œil à:

  1. Le (mauvais) comportement des marchés par (le grand) B. Mandelbrot
  2. Struck By Lightening de Jefferey Rosenthal

le premier étant plus axé sur la finance, mais toujours statistique, et le second est une introduction à tous les sujets de probabilité intéressants: les chances, le problème de Monty Hall, les fonctions utilitaires, les marches aléatoires, etc.

Cam.Davidson.Pilon
la source
5

The Tiger That Is Not Do n't de Andrew Dilnot, l'ancien présentateur d' une émission de radio populaire sur les statistiques appliquées à la BBC, est un excellent livre pour aider à la littératie statistique de base et au raisonnement statistique - et pour en justifier l'importance - .

Je le recommande souvent comme l’équivalent statistique du célèbre livre de science pop Bad Science de Ben Goldacre. C'est bon pour introduire un raisonnement statistique de base, pour montrer l'importance du raisonnement statistique de base et pour inquiéter les gens du manque de raisonnement statistique de base chez ceux qui devraient vraiment mieux connaître (en particulier les politiciens, les journalistes, etc.). Très accessible, engageant, amusant par endroits, profondément inquiétant chez les autres! Particulièrement utile comme introduction pour quiconque pense que les chiffres ne sont pas leur truc.

utilisateur56reinstatemonica8
la source
4

Ian Ayres est l'auteur du livre "Super Crunchers: Pourquoi penser par numéros est la nouvelle façon d'être intelligent" qui traite de plusieurs exemples d'exploration de données.

utilisateur1137731
la source
3

Je me suis dit que je comblerais un vide en signalant quelques bons livres du marché de masse sur les ensembles flous, la théorie de l'information, l'entropie et le raisonnement statistique que j'ai lus et que je recommande vivement.

• Pour tout ce qui est flou, McNeill, Dan, 1993, Fuzzy Logic est un bon point de départ informel. Simon et Schuster: New York.

• Pour une bonne introduction aux réseaux de neurones sur le marché de masse, organisée autour de spéculations intéressantes sur l'organisation du cerveau humain, voir Hawkins, Jeff, 2004, On Intelligence. Times Books: New York.

Pour des introductions faciles à lire sur des sujets importants tels que les pièges des statistiques et le raisonnement fallacieux, essayez ces trois:

• Huff, Darrell, 1954, Comment mentir avec les statistiques. WW Norton & Company à New York.

• Kault, David, 2003, Statistiques avec le sens commun. Greenwood Press: Westport, Connecticut.

• Smith, Gary, 2014, Écarts-types: hypothèses erronées, données torturées et autres moyens de mentir aux statistiques. Overlook Press: New York.

Les éléments suivants sont tous liés à la théorie de l'information et à l'entropie:

• Lucky, RW, 1989, Silicon Dreams: Information, Man, and Machine. Presse de St. Martin: New York.

• Cet auteur fait un excellent travail en plaçant la théorie de l’information dans son contexte et en signalant les abus, tout en écrivant de manière à ce qu’un non-spécialiste puisse saisir: Pierce, John Robinson, 1961, Symbols, Signals and Noise: The Nature and Processus de communication. Harper: New York.

• J'ai lu ce titre similaire, mais je ne me souviens plus s'il s'agit d'une édition ultérieure ou ultérieure: Pierce, John Robinson, 1980, Introduction à la théorie de l'information: symboles, signaux et bruit. Dover Publications: New York.

• Si je me souviens bien, cet auteur était facile à lire, tout en abordant des concepts plus avancés: Brillouin, Léon, 1964, Science, Incertainty and Information. Presse académique: New York.

• Voir aussi Brillouin, Léon, 1962, Science et théorie de l'information. Presse académique: New York.

• J'ai lu ceci il y a longtemps, mais je pense que cet auteur était lisible et qu'il avait quelques observations intéressantes sur la théorie de l'information: Bar-Hillel, Yehoshua, 1964, Language and Information: Essais choisis sur leur théorie et leur application. Addison-Wesley Pub. Co. Lecture, messe.

Je tiens à souligner que les livres de marché de masse traitant de sujets époustouflants tels que le chaos, l'information, la physique quantique, les probabilités, le caractère aléatoire, la "cybernétique", l'auto-organisation, les ensembles flous et l'intelligence artificielle contiennent une petite mais importante minorité de documents soufflés. hors de proportion, parfois au point d'être logiquement invalide. Chacune de ces théories a des partisans connus qui ne savent pas quand s'arrêter avec une bonne chose et font d'énormes sauts logiques pour transformer leurs domaines en explications grandioses de tout. Chacun a des auteurs qui vont bien au-delà des preuves, au point d'ignorer les avertissements explicites des fondateurs de leurs champs, comme Shannon l'a fait à propos des utilisations abusives d'entropie d'informations. Il y a une teinte fébrile et malsaine dans leur écriture, ce qui peut parfois être qualifié de «junk science» produite par des manivelles. Je pourrais citer des noms célèbres qui continuent d’imprimer des choses scandaleuses sur ces sujets, en se basant sur des erreurs logiques évidentes et des faits parfois extrêmement erronés. Je ne ferai pas cela ici pour éviter une guerre de flammes grave, car je devrais appeler des idoles et des vaches sacrées. Sachez simplement que des informations trompeuses de ce type sont disponibles et soyez prêt à les signaler. Méfiez-vous des réclamations extraordinaires sans la preuve extraordinaire requise.

SQLServerSteve
la source
2

The Drunkard's Walk de Leonard Mlodinow est une introduction facile à lire aux statistiques de base et aux probabilités. Le contenu est destiné à un public sans formation statistique ou mathématique et sans équations. Je l'ai trouvé un peu trop bête. Il existe de nombreuses anecdotes sur diverses applications de statistiques erronées et des explications claires sur la raison pour laquelle elles étaient erronées.

Le livre couvre les statistiques de base et la probabilité conditionnelle.

rien101
la source
1

Numbers Rule your World , de Kaiser Fung, décrit l’importance des statistiques dans de nombreux systèmes essentiels à la société moderne, tels que les marchés de l’assurance.

Number Sense , également de Kaiser Fung, parle plus précisément du "big data".

shadowtalker
la source
1

L'algorithme principal: Comment la quête de la machine à apprendre ultime va refaire notre monde est un livre de Pedro Domingos paru en 2015. Domingos l'a écrit pour susciter l'intérêt de personnes extérieures au domaine.

Le livre décrit cinq tribus d’apprentissage automatique: le raisonnement inductif, le connexionnisme, le calcul évolutif, le théorème de Bayes et la modélisation analogique. L'auteur explique ces tribus au lecteur en faisant référence à des processus plus compréhensibles de la logique, des connexions établies dans le cerveau, à la sélection naturelle, aux jugements de probabilité et de similarité. Tout au long du livre, il est suggéré que chaque tribu ait le potentiel de contribuer à un "algorithme maître" unificateur.

https://en.m.wikipedia.org/wiki/The_Master_Algorithm

LuisTavares
la source