Fisher pour les nuls?

11

Version courte: existe-t-il une introduction aux écrits de Ronald Fisher (articles et livres) sur les statistiques qui s'adresse à ceux qui ont peu ou pas de connaissances en statistiques? Je pense à quelque chose comme un "lecteur Fisher annoté" destiné aux non-statisticiens.

J'explique la motivation de cette question ci-dessous, mais sachez qu'elle est de longue haleine (je ne sais pas comment l'expliquer plus succinctement), et en plus c'est presque certainement controversé, peut-être ennuyeux, peut-être même exaspérant. Alors s'il vous plaît, sautez le reste de ce post à moins que vous ne pensiez vraiment que la question (comme indiqué ci-dessus) est trop laconique pour être répondue sans autre clarification.


Je me suis enseigné les bases de nombreux domaines que beaucoup de gens jugeraient difficiles (par exemple, l'algèbre linéaire, l'algèbre abstraite, l'analyse réelle et complexe, la topologie générale, la théorie des mesures, etc.) Mais tous mes efforts pour m'enseigner moi-même les statistiques ont échoué .

La raison en est non pas que je trouve les statistiques techniquement difficiles (ou plus que les autres domaines dans lesquels j'ai réussi à trouver mon chemin), mais plutôt que je trouve les statistiques toujours étrangères , sinon carrément bizarres , beaucoup plus que tout autre autre domaine que je me suis enseigné.

Lentement, j'ai commencé à soupçonner que les racines de cette bizarrerie sont principalement historiques et que, en tant que personne qui apprend ce domaine à partir de livres, et non d'une communauté de praticiens (comme cela aurait été le cas si j'avais été formellement formé aux statistiques ), Je ne dépasserais jamais ce sentiment d'aliénation avant d'en savoir plus sur l' histoire des statistiques.

J'ai donc lu plusieurs livres sur l'histoire des statistiques, et cela a, en fait, fait beaucoup de chemin pour expliquer ce que je perçois comme l'étrangeté du champ. Mais j'ai encore du chemin à faire dans cette direction.

L'une des choses que j'ai apprises de mes lectures dans l'histoire des statistiques est que la source d'une grande partie de ce que je perçois comme bizarre dans les statistiques est un homme, Ronald Fisher.

En fait, la citation suivante 1 (que je n'ai trouvée que récemment) est très en accord avec ma prise de conscience que ce n'est qu'en fouillant dans une certaine histoire que j'allais commencer à donner un sens à ce domaine, ainsi que ma mise à zéro sur Fisher comme mon point de référence:

La plupart des concepts et théories statistiques peuvent être décrits séparément de leurs origines historiques. Cela n'est pas possible, sans mystification inutile, dans le cas de la "probabilité fiduciaire".

En effet, je pense que mon intuition ici, bien que subjective (bien sûr), n'est pas entièrement infondée. Fisher a non seulement contribué à certaines des idées les plus importantes en statistique, il était connu pour son mépris des travaux antérieurs et pour sa confiance en l'intuition (soit en fournissant des preuves que presque personne d'autre ne pouvait sonder, soit en les omettant complètement). En outre, il a eu des querelles à vie avec de nombreux autres statisticiens importants de la première moitié du 20e siècle, des querelles qui semblent avoir semé beaucoup de confusion et de malentendus sur le terrain.

Ma conclusion à partir de tout cela est que, oui, les contributions de Fisher aux statistiques modernes étaient en effet de grande envergure, même si elles n'étaient pas toutes positives.

J'ai également conclu que pour vraiment aller au fond de mon sentiment d'aliénation avec les statistiques, je devrai lire au moins certaines des œuvres de Fisher, dans leur forme originale.

Mais j'ai trouvé que l'écriture de Fisher est à la hauteur de sa réputation d'impénétrabilité. J'ai essayé de trouver des guides sur cette littérature, mais, malheureusement, tout ce que j'ai trouvé est destiné à des personnes formées en statistique, il est donc aussi difficile pour moi de comprendre que ce qu'il prétend élucider.

D'où la question au début de ce billet.


1 Stone, Mervyn (1983), "Fiducial probabilité", Encyclopedia of Statistical Sciences 3 81-86. Wiley, New York.

kjo
la source
2
En ce qui concerne les statistiques fiduciales, je pense que certaines de ces caractérisations des arguments de Fisher pourraient être correctes et s'appliquent presque autant à certains de ses autres travaux, mais ce n'est certainement pas le cas de tous ses travaux statistiques. Certains de ses arguments géométriques en relation avec le et le chi carré étaient des modèles de clarté et de perspicacité. t
Glen_b -Reinstate Monica
@Glen_b: Je vous crois sur parole, mais, au moins en ce qui concerne t , K. Pearson a rejeté pour publication l'article initial de Fisher sur t parce qu'il ne pouvait pas suivre la preuve de Fisher, et l'a dit très explicitement dans sa correspondance avec Gosset. Gosset ne pouvait pas non plus suivre la preuve de Fisher.
kjo
1
Oui, c'est tout à fait vrai. Néanmoins, après avoir lu plusieurs articles de Fisher des années 20 moi-même, soit ses derniers articles étaient plus clairs que les précédents (ce qui semble probable), ou, peut-être, la performance de Pearson pourrait avoir été affectée par l'histoire et les conséquences potentielles de ses interactions. avec Fisher.
Glen_b -Reinstate Monica

Réponses:

8

Un Fisher annoté serait une excellente ressource!

Je ne pense pas que vous serez en mesure de comprendre Fisher sans essayer en même temps de comprendre d'autres parties importantes du développement des statistiques et les interactions de Fisher avec les autres contributeurs importants. J'ai trouvé les statistiques en psychologie: une perspective historique de Michael Cowles très utiles. (Ne laissez pas la partie psychologique du titre vous décourager: le livre est assez général et semble être un compte très impartial.)

Au sujet de Fisher annoté, j'ai tout récemment annoté un de ses paragraphes quand on m'a demandé de justifier une affirmation selon laquelle Fisher proposait des valeurs de P comme indices de preuve contre l'hypothèse nulle. Voici comment j'ai répondu:

J'ai regardé un peu autour sans trouver de spécification exacte parce que, comme d'habitude, l'écriture de Fisher est maladroite et nécessite une interprétation laborieuse de la part du lecteur. Il dit à la p. 46 de Méthodes statistiques et inférence scientifique (j'ai la dernière édition):

"Bien qu'il soit reconnaissable comme une condition psychologique de réticence ou de résistance à l'acceptation d'une proposition, le sentiment induit par un test de signification a une base objective en ce que l'énoncé de probabilité sur lequel il se fonde est un fait communicable et vérifiable par , d'autres esprits rationnels. Le niveau de signification dans de tels cas remplit les conditions d'une mesure des motifs rationnels de l'incrédulité qu'il engendre. Il est plus primitif ou élémentaire que, et ne justifie pas, toute déclaration de probabilité exacte sur la proposition. "

Le voici à nouveau, avec mes déclarations éditoriales et interprétatives:

dont l'incompréhension ou la mauvaise application des principes du test de signification est critiquée par Fisher dans son paragraphe précédent.]. Le niveau de signification dans de tels cas [la valeur P] remplit les conditions d'une mesure des motifs rationnels de l'incrédulité qu'elle engendre [c'est-à-dire des preuves]. Il est plus primitif ou élémentaire que tout énoncé de probabilité exact sur la proposition, et ne le justifie pas [et peut donc être un indice, mais pas une mesure de probabilité.]. "

Michael Lew
la source
2
La remarque d'ouverture de votre réponse m'a donné l'idée de lancer un wiki "Fisher annoté" ... Une pensée oiseuse, vraiment, puisque je n'ai jamais rien fait de tel à distance. En particulier, je n'ai aucune idée de ce qu'il faut pour créer et gérer un wiki, et j'ai encore moins la moindre idée des problèmes juridiques / de droits d'auteur qui devraient être traités pour lancer un tel projet. Je suis d'accord, cependant: ce serait une ressource vraiment inestimable.
kjo