Pourquoi le lemme de Neyman-Pearson est-il un lemme et non un théorème?

10

Il s'agit plus d'une question d'histoire que d'une question technique.

Pourquoi le `` lemme de Neyman-Pearson '' est-il un lemme et non un théorème?

lien vers le wiki: https://en.wikipedia.org/wiki/Neyman%E2%80%93Pearson_lemma

NB : La question n'est pas de savoir ce qu'est un lemme et comment les lemmes sont utilisés pour prouver un théorème, mais de l'histoire du lemme de Neyman-Pearson. A-t-il été utilisé pour prouver un théorème, puis il s'est avéré plus utile? Existe-t-il des preuves irréfutables que cela a été le cas?

Tauto
la source
6
Terminologie : Un lemme est un "théorème d'aide", une proposition avec peu d'applicabilité, sauf qu'il fait partie de la preuve d'un théorème plus large. Dans certains cas, à mesure que l'importance relative des différents théorèmes devient plus claire, ce qui était autrefois considéré comme un lemme est maintenant considéré comme un théorème, bien que le mot "lemme" reste dans le nom.
Carl
2
@Carl bien sûr, mais pourquoi le lemme de Neyman-Pearson est-il un lemme et non un théorème? y avait-il un théorème? et y en a-t-il des preuves? Comme je l'ai dit, c'est une question d'histoire, pas une question technique.
Tauto
2
Eh bien, le lemme NP est utilisé pour prouver le théorème de Karlin-Rubin, et que le test de score de Rao est localement le plus puissant; ces résultats sont peut-être appliqués plus largement que le lemme NP lui-même (alternative point nul vs point).
Scortchi - Réintégrer Monica

Réponses:

-2

NB: C'est historiquement la première réponse à la question OP. En statistique, le lemme Neyman – Pearson a été introduit par Jerzy Neyman et Egon Pearson dans un article de 1933 .. En outre, il est utilisé dans la pratique par les statisticiens comme théorème , pas comme un lemme, et il est appelé un lemme en grande partie à cause du document de 1936. À mon humble avis, le traitement historique ne répond pas à la question «pourquoi», et ce message tente de le faire.

Ce qu'est un lemme par opposition à un théorème ou corollaire est abordé ailleurs et ici . Plus exactement, en matière de définition: Lemme, premier sens : Un théorème subsidiaire ou intermédiaire dans un argument ou une preuve. Je suis d'accord avec le dictionnaire d'Oxford, mais j'aurais changé l'ordre des mots et noté la langue exacte: théorème intermédiaire ou subsidiaire. Certains auteurs croient à tort qu'un lemme doit être intermédiaire dans une preuve, et c'est le cas de nombreux lemmes sans nom. Cependant, il est courant, au moins pour les lemmes nommés, que le résultat du lemme soit une implication découlant d'un théorème déjà prouvé tel que le lemme est un théorème supplémentaire, c'est-à-dire subsidiaire. De l' Encyclopédie du Nouveau Monde La distinction entre théorèmes et lemmes est assez arbitraire, car le résultat majeur d'un mathématicien est la revendication mineure d'un autre. Le lemme de Gauss et le lemme de Zorn, par exemple, sont suffisamment intéressants en soi pour que certains auteurs présentent le lemme nominal sans continuer à l'utiliser dans la preuve d'un théorème. Un autre exemple de ceci est le lemme d'Evans, qui ne découle pas de la preuve d' un simple théorème de géométrie différentielle qui ... montre que la première équation de la structure de Cartan est une égalité de deux postulats tétrades ... Le postulat tétrade [ Sic , lui-même] est la source du lemme d'Evans de géométrie différentielle. Wikipédia mentionne l'évolution des lemmes dans le temps:Dans certains cas, à mesure que l'importance relative de différents théorèmes devient plus claire, ce qui était autrefois considéré comme un lemme est maintenant considéré comme un théorème, bien que le mot "lemme" reste dans le nom.

Cependant, notez bien que les lemmes autonomes ou non sont également des théorèmes. C'est-à-dire qu'un théorème qui est un lemme peut parfois être une réponse à la question "Qu'est-ce que le théorème (ci-dessus) implique?" Parfois, les lemmes sont un tremplin utilisé pour établir un théorème.

Il ressort de la lecture du document de 1933: IX. Sur le problème des tests les plus efficaces d'hypothèses statistiques. Jerzy Neyman, Egon Sharpe Pearson et Karl Pearson , que le théorème étudié est le théorème de Bayes . Certains lecteurs de cet article ont du mal à relier le théorème de Bayes au document de 1933 malgré une introduction assez explicite à cet égard. Notez que l'article de 1933 est jonché de diagrammes de Venn, les diagrammes de Venn illustrent la probabilité conditionnelle , qui est le théorème de Bayes. Certaines personnes appellent cela la règle de Bayes, car il est exagéré de se référer à cette règle comme étant un «théorème». Par exemple, si nous appelions «addition» un théorème, au lieu d'être une règle, nous confondrions plutôt qu'expliquerions.

Par conséquent, le lemme de Neyman-Pearson est un théorème concernant le test le plus efficace des hypothèses bayésiennes, mais il n'est pas actuellement appelé ainsi parce qu'il n'était pas au départ.

Carl
la source
1
Je suis un peu confus quant à ce que vous dites exactement ici. Il est clair que le lemme NP n'est pas utilisé pour prouver le théorème de Bayes, dans cet article ou ailleurs. Donc la question "Pourquoi 'lemme'?" restes. Le lemme NP est utilisé dans les sections III et IV de cet article dans la dérivation de tests similaires UMP, et pourrait à juste titre être appelé un lemme pour cette raison.
Scortchi - Réintégrer Monica
3
Votre affirmation "Par conséquent, le lemme de Neyman-Pearson pourrait être appelé un théorème" n'est pas fondée et n'explique en rien pourquoi nous appelons le "lemme de Neyman-Pearson" un lemme. De plus, ce qu'il a à voir avec le théorème de Bayes n'est pas clair et semble faux. Votre réponse mérite des downvotes pour être vague et absurde, mais comme vous n'aimez pas ces downvotes, je dirai simplement qu'elle les mérite sans en donner.
Sextus Empiricus
2
Un lemme n'est qu'un théorème (placé uniquement dans un contexte différent en tant qu '«aide» dans une preuve plus large). Ce n'est pas la question et il a été répondu dans plusieurs discussions sur le site de mathématiques. Nous savons que les lemmes peuvent commencer à vivre leur propre vie (sans leur ancien théorème qu'ils ont aidé). La question demande explicitement l'histoire de ceci en relation avec le lemme de Neyman Pearson. Francis a déjà donné une bonne réponse à cela et il n'y a pas besoin d'une autre réponse. J'ai critiqué votre réponse car elle est déroutante (avec des choses sur la règle de Bayes) et n'est pas utile ni même préjudiciable.
Sextus Empiricus
4
Avez-vous une source pour cette interprétation / utilisation du mot «lemme»? Sinon, je crois que vous avez tout simplement mal compris ce que signifie le «lemme». Pour emprunter le langage de la réponse liée du site compagnon, j'interpréterais les versions actuelles et précédentes de cette question comme signifiant "Quel est le résultat le plus significatif pour lequel le lemme Neyman-Pearsion était un fait" d'aide "".
Juho Kokkala
2
"C'est une exagération car il n'est pas nécessaire que ce soit" un autre "." D' où vient cette affirmation? Cela (sans faire partie, à l'origine, d'une preuve d'un «autre» théorème) n'est pas ainsi que les mathématiciens utilisent le terme lemme. Il est très similaire à l'utilisation dans la logique A -> B -> C et la question demande ce qu'est C dans le cas du lemme B étant le lemme de Neyman Pearson (ce n'est certainement pas la règle / théorème de Bayes).
Sextus Empiricus
9

La version classique apparaît en 1933, mais la plus ancienne occasion de l'appeler un "lemme" se trouve peut-être dans l'article de Neyman et Pearson de 1936 Contributions à la théorie des tests d'hypothèses statistiques (pp. 1-37 de Statistical Research Memoirs Volume I) . Le lemme et la proposition qu'il a été utilisé pour prouver étaient les suivants: entrez la description de l'image ici

Il est connu aujourd'hui sous le nom de lemme fondamental de Neyman-Pearson généralisé (cf. chapitre 3.6 des tests statistiques de Lehman et Romano ), et il se réduit à votre Neyman-Pearson quotidien lorsque . Le lemme lui-même a ensuite été étudié par plusieurs grands noms de cette époque (par exemple PL Hsu, Dantzig, Wald, Chernoff, Scheffé) et le nom "Neyman and Pearson's lemma" est resté ainsi.m=1

Voici une liste d'articles / livres pertinents si vous êtes intéressé par l'histoire du lemme de Neyman-Pearson:

  • L'histoire de Neyman – Pearson: 1926-34 , ES Pearson, dans Research Papers in Statistical: Festschrift for J. Neyman .
  • Introduction à Neyman et Pearson (1933) sur le problème des tests les plus efficaces d'hypothèses statistiques , EL Lehmann, dans Breakthroughs in Statistics: Foundations and Basic Theory .
  • Neyman-From Life , C. Reid.
Francis
la source
Oui, mais le lemme de Neyman-Pearson correspondait à la définition d'un lemme en 1933, c'est-à-dire que c'était un lemme à cette époque, c'est pourquoi il a ensuite été appelé lemme.
Carl
1
@Carl, quel est votre point en utilisant «mais». Y a-t-il un problème avec cette réponse?
Sextus Empiricus
1
@MartijnWeterings: vous pouvez rechercher le terme sur Google Scholar et limiter la plage de dates. La première utilisation est de PL Hsu, semble-t-il. La note de conférence de Wald de 1940 l'a également citée.
Francis
2
@Carl, avez-vous manqué la partie suivante? " NB : La question n'est pas de savoir ce qu'est un lemme et comment les lemmes sont utilisés pour prouver un théorème, mais de l'histoire du lemme de Neyman-Pearson." Il s'agit de l' histoire . La question demande dans quel contexte ce théorème est devenu un lemme. Pas pourquoi un théorème (ou plus précisément ce théorème) peut être appelé un lemme.
Sextus Empiricus
2
@Carl, cette réponse explique bien comment il a rempli ce rôle et comprend un historique de la façon dont les gens ont regardé ce rôle.
Sextus Empiricus