Définition fréquentiste de la probabilité; existe-t-il une définition formelle?

10

Existe-t-il une définition formelle (mathématique) de ce que les fréquentistes entendent par «probabilité»? J'ai lu que c'est la fréquence relative d'occurrence «à long terme», mais existe-t-il un moyen formel de la définir? Y a-t-il des références connues où je peux trouver cette définition?

ÉDITER:

Par fréquentiste (voir le commentaire de @whuber et mes commentaires sur la réponse @Kodiologist et @Graeme Walsh ci-dessous), je veux dire ceux qui «croient» que cette fréquence relative à long terme existe. Peut-être que cela répond (en partie) à la question de @Tim également


la source
7
Veuillez expliquer ce que vous entendez par «Frequentist». Les utilisations que j'ai vues dans d'autres discussions indiquent que beaucoup de gens n'ont pas de sens cohérent ou clair de ce que ce terme pourrait signifier. Une définition aiderait donc à garder toutes les réponses pertinentes.
whuber
5
@whuber Je suppose que la définition du fréquentiste est "non bayésien" et du bayésien est "non fréquentiste" dans la plupart des cas :)
Tim
1
Étroitement liés: en.wikipedia.org/wiki/Empirical_probability
Silverfish
2
J'allais dire que cette stats.stackexchange.com/a/230943/113090 vous intéresserait probablement, mais j'ai réalisé que vous êtes la personne qui a posté cette réponse, alors tant pis. Quoi qu'il en soit, votre processus de réflexion pourrait intéresser d'autres personnes qui ont également la même question que vous (par exemple moi) "existe-t-il une définition fréquentiste formelle de la probabilité"
Chill2Macht
6
Je ne suis pas sûr d'avoir l'énergie nécessaire pour écrire une réponse moi-même, mais je voudrais laisser ici le même lien vers l'entrée de la Stanford Encyclopedia of Philosophy sur les interprétations des probabilités que j'ai publiée sous votre réponse dans le fil connexe. La section sur l'interprétation / définition fréquentiste est une bonne lecture. Il parle en détail de divers problèmes conceptuels avec des tentatives pour donner une définition fréquentiste de la probabilité.
amoeba

Réponses:

4

TL; DR Il ne semble pas possible de définir une définition fréquentiste de probabilité cohérente avec le cadre de Kolmogorov qui ne soit pas complètement circulaire (c'est-à-dire au sens de la logique circulaire).

Pas trop longtemps donc j'ai lu: je veux aborder ce que je considère comme des problèmes potentiels avec la définition fréquentiste candidate de la probabilité Tout d'abord, ne peut être raisonnablement interprétée que comme une variable aléatoire, de sorte que l'expression ci-dessus n'est pas précisément définie dans un sens rigoureux. Il faut préciser le mode de convergence de cette variable aléatoire, que ce soit presque sûrement, en probabilité, en distribution, en moyenne, ou en moyenne au carré.

limnnAn
nA

Mais toutes ces notions de convergence nécessitent qu'une mesure sur l'espace de probabilité à définir soit significative. Le choix intuitif, bien sûr, serait de choisir presque sûrement la convergence. Cela a pour caractéristique que la limite doit exister ponctuellement, sauf en cas de mesure nulle. Ce qui constitue un ensemble de mesures nul coïncidera pour toute famille de mesures qui sont absolument continues les unes par rapport aux autres - cela nous permet de définir une notion de convergence presque sûre rendant rigoureuse la limite ci-dessus tout en restant quelque peu agnostique quant à ce que le sous-jacent mesure pour l'espace mesurable des événements est (c'est-à-dire parce qu'il pourrait s'agir de n'importe quelle mesure absolument continue par rapport à une mesure choisie). Cela empêcherait la circularité de la définition qui résulterait de la fixation préalable d'une mesure donnée,

Cependant, si nous utilisons une convergence presque sûre, cela signifie que nous nous limitons à la situation de la loi forte des grands nombres (désormais SLLN). Permettez-moi d'énoncer ce théorème (comme donné à la p. 133 de Chung) pour référence ici:

Soit une séquence de variables aléatoires indépendantes et distribuées de manière identique. Ensuite, nous avons où .{Xn}

E|X1|<SnnE(X1)a.s.
E|X1|=limsupn|Sn|n=+a.s.
Sn:=X1+X2++Xn

Disons donc que nous avons un espace mesurable et nous voulons définir la probabilité d'un événement par rapport à une famille de mesures de probabilité mutuellement absolument continues . Ensuite, par le théorème d'extension de Kolmogorov ou le théorème d'extension Ionescu Tulcea (je pense que les deux fonctionnent), nous pouvons construire une famille d'espaces de produits , un pour chaque . (Notez que l'existence d'espaces de produits infinis qui est une conclusion du théorème de Kolmogorov nécessite que la mesure de chaque espace soit , c'est pourquoi je me limite maintenant aux mesures de probabilité, au lieu d'arbitraires). Définissez ensuite(X,F)AF{μi}iI{(j=1Xj)i}iIμi11Aj pour être la variable aléatoire indicatrice, c'est-à-dire qui est égale à si apparaît dans la ème copie et si ce n'est pas le cas, en d'autres termesAlors clairement (où dénote une attente par rapport à ), donc la loi forte des grands nombres sera en fait appliquer à (car par construction le1Aj0

nA=1A1+1A2++1An.
0Ei1Aj1Eiμi(j=1Xj)i1Ajsont distribués de manière identique et indépendante - notez qu'être distribué de manière indépendante signifie que la mesure de l'espace produit est multiplicative par rapport aux mesures de coordonnées) donc nous obtenons que et donc notre définition de la probabilité de par rapport à devrait naturellement être .
nAnEi1A1a.s.
AμiE11A

Je viens de réaliser cependant que même si la séquence de variables aléatoires convergera presque sûrement par rapport à si et seulement si elle converge presque sûrement par rapport à , ( où ) cela ne signifie pas nécessairement qu'il convergera vers la même valeur ; en fait, le SLLN garantit qu'il ne le sera que si ce qui n'est pas vrai de façon générique.nAnμi1μi2i1,i2IEi11A=Ei21A

Si est en quelque sorte "assez canonique", disons comme la distribution uniforme pour un ensemble fini, alors peut-être que cela fonctionne bien, mais ne donne pas vraiment de nouvelles perspectives. En particulier, pour la distribution uniforme, , c'est-à-dire que la probabilité de est juste la proportion de points ou d'événements élémentaires dans qui appartiennent à , qui me semble encore un peu circulaire. Pour une variable aléatoire continue, je ne vois pas comment nous pourrions jamais nous mettre d'accord sur un choix "canonique" de .μE1A=|A||X|AXAμ

C'est-à-dire qu'il semble logique de définir la fréquence d'un événement comme la probabilité de l'événement, mais il ne semble pas qu'il soit logique de définir la probabilité que l'événement soit la fréquence (au moins sans être circulaire). Ceci est particulièrement problématique, car dans la vie réelle, nous ne savons pas réellement quelle est la probabilité; nous devons l'estimer.

Notez également que cette définition de la fréquence pour un sous-ensemble d'un espace mesurable dépend de la mesure choisie étant un espace de probabilité; par exemple, il n’existe pas de mesure de produit pour de nombreuses copies de dotées de la mesure de Lebesgue, car . De même, la mesure de utilisant la mesure de produit canonique est , qui explose à l'infini si ou va à zéro si , c'est-à-dire que les théorèmes d'extension de Kolmogorov et Tulcea sont des résultats très particuliers propres aux mesures de probabilité .Rμ(R)=j=1nX(μ(X))nμ(X)>1μ(X)<1

Chill2Macht
la source
1
Merci pour la belle réponse (+1). Je conviens qu'il y a des «problèmes» avec la définition en termes de fréquence relative à long terme, c'est probablement l'une des raisons pour lesquelles Kolmogorov a développé son Grundbegriffe. Cependant, lorsque nous parlons de fréquentistes, nous devons nous placer dans le laps de temps avant la théorie de Kolmogorov, je pense?
2
@fcop Je suppose honnêtement que je n'en ai aucune idée. Je suppose que ce que j'essaie de dire, c'est que je ne vois pas comment une justification rigoureuse de la compréhension fréquentiste de la probabilité pourrait conduire à une définition utile / non circulaire.
Chill2Macht
@fcop J'apprécie vraiment la générosité généreuse - j'étais de très mauvaise humeur aujourd'hui avant de la recevoir. Honnêtement, cela m'a quelque peu terrassé (dans le bon sens). Encore une fois, j'apprécie vraiment
Chill2Macht
ne le mentionnez pas, votre réponse est très bien développée et mathématiquement solide.
6

Je ne pense pas qu'il y ait de définition mathématique, non. La différence entre les diverses interprétations de la probabilité n'est pas une différence dans la façon dont la probabilité est définie mathématiquement. La probabilité pourrait être définie mathématiquement de cette façon: si est un espace de mesure avec , alors la probabilité de tout événement est juste . J'espère que vous convenez que cette définition est neutre par rapport à des questions comme celle de savoir si nous devons interpréter les probabilités de manière fréquentiste ou bayésienne.(Ω,Σ,μ)μ(Ω)=1SΣμ(S)

Kodiologue
la source
c'est bien mais cette définition de la probabilité comme qui remplit les axiomes de Kolmogorov est très abstraite, elle doit être définie dans des cas spécifiques. C'est la même chose que «un cercle est l'ensemble de points qui est à une distance donnée d'un point fixe». Cela ne veut rien dire tant que vous ne dites pas dans quel espace métrique vous vous trouvez: vous devez dire quelle est la définition de la «distance». Je pense que définir comme une fréquence relative à long terme remplit les axiomes de Kolmogorov, qu'en pensez-vous? PS La définition dans le commentaire de @Silverfish remplit également ces axiomes. μP
(suite) donc pour faire court, je peux définir ( définir est le bon mot), beaucoup qui remplissent les axiomes de Kolmogorov et ce sont toutes des probabilités valides selon la théorie axiomatique. μ
On peut soutenir que le système de Kolmogorov fournit une base axiomatique - qui n'implique pas nécessairement une interprétation fréquentiste ou bayésienne. Dans l'esprit du point de vue fréquentiste, l'idée de base est qu'à mesure que le nombre d'essais augmente jusqu'à l'infini, la fréquence empirique se stabilise autour d'une valeur ou converge vers une certaine valeur; la probabilité de l'événement. Bien que l'approche fréquentielle améliore l'approche classique, le manque de rigueur conduit au fondement axiomatique. S'agit-il plutôt d'une question sur l'histoire de la théorie des probabilités?
limn(nA/n)=PA=P(A).
Graeme Walsh
@Graeme Walsh: pourriez-vous mettre cela dans une réponse, et le compléter avec des arguments pourquoi une telle définition de est conforme aux axiomes de Kolmogorov? (bien sûr on peut s'interroger sur l'existence de la limite, mais alors on pourrait dire que les fréquentistes sont ceux qui '' croient '' en son existence?)P(A)
2
@fcop Comme le note Walsh, cette "définition" n'est pas rigoureuse.
Kodiologist