Probabilité qu'une variable aléatoire continue suppose un point fixe

11

Je suis dans une classe de statistiques d'introduction dans laquelle la fonction de densité de probabilité pour les variables aléatoires continues a été définie comme . Je comprends que l'intégrale de mais je ne peux pas rectifier cela avec mon intuition d'une variable aléatoire continue. Disons que X est la variable aléatoire égale au nombre de minutes à partir du moment t où le train arrive. Comment calculer la probabilité que le train arrive exactement dans 5 minutes? Comment cette probabilité peut-elle être nulle? N'est-ce pas possible? Que faire si le train n'arrive exactement 5 minutes à partir de maintenant, comment pourrait - il se produire s'il y avait probabilité 0?a a f ( x ) d x = 0P{XB}=Bf(x)dxaaf(x)dx=0

Merci.

geofflittle
la source
2
Il est utile de poser certaines de ces questions sur leur tête. Par exemple , si votre intuition dit que chaque instant possible doit avoir une probabilité strictement positive, alors - parce qu'il y a un nombre incalculable de moments possibles dans n'importe quel intervalle - votre intuition implique que la probabilité totale est infinie. De toute évidence, cette intuition est fausse. Il faut renoncer à l'idée qu'une probabilité de zéro implique une impossibilité: ce n'est pas vrai. De même, une probabilité de un n'implique pas une certitude.
whuber
@whuber C'est ce que je ne peux pas rectifier. Si la probabilité qu'un événement se produise est de 0, cela ne devrait jamais se produire. Par exemple, si j'ai un dé standard à six faces, la probabilité que je lance n'importe quel nombre est de 0 et sera donc n'arrive jamais. De plus, comment un événement de probabilité 1 ne peut-il pas être une certitude dans l'expérience suivante? Pourriez-vous fournir un exemple? Z{1,2,3,4,5,6}
geofflittle
1
Supposons que vous voyez un cercle dans lequel un accord est montré et il semble être un diamètre, vous invitant à vous demander "quelle était la chance qu'un accord sélectionné au hasard n'aurait pas été un diamètre?" Lorsque l'accord est obtenu en choisissant une paire de points uniformément et indépendamment le long de la circonférence, la réponse est , mais cet événement ne s'est pas produit. Cela fournit (assez fort!) La preuve que l'accord n'était pas le résultat du processus aléatoire que vous avez posé. Une leçon offerte par de telles expériences de pensée est que les intuitions basées sur des espaces de probabilité finie ne se généralisent pas toujours. 1
whuber

Réponses:

8

Vous tombez peut-être dans le piège de considérer «cinq minutes à partir de maintenant» comme une durée limitée (qui aurait une probabilité non nulle).

«Cinq minutes à partir de maintenant» au sens variable continu est vraiment instantané.

Imaginez que l'arrivée du prochain train soit uniformément répartie entre 8h00 et 8h15. Imaginez davantage que nous définissons l' arrivée d'un train comme se produisant à l'instant où l'avant du train passe un point particulier sur la gare (peut-être le milieu de la plate-forme s'il n'y a pas de meilleur point de repère). Considérez la séquence de probabilités suivante:

a) la probabilité qu'un train arrive entre 8h05 et 8h10

b) la probabilité qu'un train arrive entre 8h05 et 8h06

c) la probabilité qu'un train arrive entre 8:05:00 et 8:05:01

d) la probabilité qu'un train arrive entre 8:05:00 et 8: 05: 00.01 (c'est-à-dire en l'espace d'un centième de seconde

e) la probabilité qu'un train arrive entre 8h05 et un milliardième de seconde plus tard

f) la probabilité qu'un train arrive entre 8h05 et un quadrillionième de seconde plus tard

... etc

La probabilité qu'elle arrive précisément à 8h05 est la valeur limite d'une séquence de probabilités comme celle-là. La probabilité est inférieure à chaque .ϵ>0

Glen_b -Reinstate Monica
la source
Je comprends cela, mais, en supposant que le train arrive, il arrive à un moment donné. Pourquoi cette limite ne peut-elle pas encore converger vers une certaine probabilité?
geofflittle
Si vous le comprenez, comme vous le dites, vous pouvez calculer la probabilité de la manière indiquée. Permettez-moi de vous faciliter la tâche: imaginez, pour des raisons de commodité de calcul, que l'heure exacte à laquelle un train "arrive" (quelle que soit la définition, tant qu'il est effectivement continu) à une heure uniformément répartie sur l'intervalle (0,1) (à quelque est une unité de temps pratique). Quelle est la probabilité que le train arrive avant le temps , pour certains à l'intérieur de l'intervalle? Quelle est la probabilité qu'il arrive après le temps ? Quelle est la probabilité qu'il arrive entre et ? ... (ctd)x x x x + d xxxxxx+dx
Glen_b -Reinstate Monica
(ctd) ... Pour le dire « arrive au moment » pour une variable continue, signifie « ce qui est la limite de cette dernière probabilité que . Alors, quelle est cette limite? SAVOIR! C'est la probabilité à laquelle il converge. Cette caractéristique est intimement liée à ce qui fait qu'un pdf continu est continud x 0 ?xdx0?
Glen_b -Reinstate Monica
Notez en outre que si cette dernière limite est tout sauf zéro, vos trois probabilités (avant , après et "at" ) ne s'ajouteront pas à 1.x xxxx
Glen_b -Reinstate Monica
5

Que se passe-t-il si le train arrive exactement dans 5 minutes, comment pourrait-il se produire s'il avait une probabilité de 0?

Une déclaration probabiliste n'est pas une déclaration sur la possibilité / faisabilité d'un événement. Cela ne reflète que notre tentative de quantifier notre incertitude à ce sujet. Ainsi, lorsqu'un phénomène est continu (ou modélisé comme tel), nos outils et l'état actuel des connaissances ne nous permettent pas de faire une déclaration probabiliste à ce sujet en prenant une valeur spécifique . Nous ne pouvons faire une telle déclaration liée à une plagedes valeurs. Bien sûr, l'astuce habituelle est de discrétiser le support, de considérer des "petits" intervalles de valeurs plutôt que des valeurs uniques. Étant donné que les variables aléatoires continues apportent de grands avantages et une grande flexibilité par rapport aux variables aléatoires discrètes, cela s'est avéré être un prix assez faible à payer, peut-être aussi petit que les intervalles que nous sommes obligés de considérer.

Alecos Papadopoulos
la source
Ces déclarations sont déroutantes, peut-être parce qu'elles pourraient être interprétées de tant de façons différentes. À certains endroits, vous semblez nier la validité de l'utilisation de distributions continues pour modéliser les phénomènes - et faire une distinction nette entre le phénomène et le modèle - et à d'autres endroits, vous semblez supprimer complètement cette distinction. Ma lecture de celui-ci, que je soupçonne n'était pas destinée, est que vous soutenez que le fait mathématique que pour tout RV continu est en réalité toujours faux, mais cela donne l'impression que vous niez l'applicabilité de la théorie des probabilités! Pr(X=a)=0X
whuber
2
Salut @whuber. En ce qui concerne la distinction entre modèle et phénomène, une carte de la terre n'est pas la terre, mais elle peut vous aider à parcourir la terre. C'est ainsi que je pense les modèles, quand je ne les traite pas comme des objets de pur plaisir intellectuel (ce qu'ils sont aussi). Quant à la question de la «probabilité nulle», c'est une imperfection - après tout, ne serait-il pas formidable d'avoir tous les avantages de la continuité et de pouvoir faire une déclaration de probabilité sur une seule valeur? Mais le fait d'être imparfait ne rend pas quelque chose d'inapplicable bien sûr, et au moment où j'écris, cette imperfection s'est avérée de peu d'importance.
Alecos Papadopoulos
Vous supposez implicitement que la probabilité est quelque chose d'objectif "là-bas" dans votre analogie de cartographie, mais ce n'est pas le cas. La probabilité n'a de sens que dans un modèle. Je ne vois aucune "imperfection" dans les axiomes de probabilité et en effet, on peut faire des déclarations précises et cohérentes sur les probabilités de valeurs uniques: souvent elles sont nulles.
whuber
2
@whuber Non, je ne suppose pas cela, et je ne comprends pas où avez-vous vu cela dans ce que j'ai écrit. J'ai dit "la carte n'est pas la terre", ce qui signifie "ce qui est dans le modèle n'existe pas en réalité", alors comment pouvez-vous en déduire exactement le contraire? L '«imperfection» ne se réfère pas aux axiomes de probabilité, mais à quels outils ces axiomes nous conduisent, et à quelle efficacité ces outils peuvent être utilisés pour modéliser, étudier et comprendre le monde réel. Et il est évident que je crois que la probabilité est un outil efficace.
Alecos Papadopoulos
4

Pour vous donner une idée de ce qui précède, essayez l'expérience (de pensée) suivante:

Tracez une vraie ligne autour de zéro avec une règle. Maintenant, prenez une fléchette pointue et laissez-la tomber d'en haut au hasard sur la ligne (supposons que vous frapperez toujours la ligne et que seul le positionnement latéral compte pour l'argument).

Quelle que soit la fréquence à laquelle vous laissez la fléchette tomber au hasard sur la ligne, vous n'atteindrez jamais le point zéro. Pourquoi? Pensez quel est le point zéro, pensez quelle est sa largeur. Et après avoir reconnu que sa largeur est de 0, pensez-vous toujours pouvoir la frapper?

Serez-vous capable d'atteindre le point 1 ou -2? Ou tout autre point que vous choisissez sur la ligne d'ailleurs?

Pour revenir aux mathématiques, c'est la différence entre le monde physique et un concept mathématique tel que les nombres réels (représentés par la ligne réelle dans mon exemple). La théorie des probabilités a une définition de la probabilité un peu plus compliquée que vous ne le verrez dans votre exposé. Pour quantifier la probabilité d'événements et toute combinaison de leurs résultats, vous avez besoin d'une mesure de probabilité. La mesure de Borel et la mesure de Lebesgue sont définies pour un intervalle [a, b] sur la ligne réelle comme: partir de cette définition, vous pouvez voir ce qui se passe avec la probabilité si vous réduisez l'intervalle à un nombre (réglage a = b).

μ([a,b])=ba

L'essentiel est que, sur la base de notre définition actuelle de la théorie des probabilités (remontant à Kolmogorov), le fait qu'un événement ait 0 probabilité ne signifie pas qu'il ne peut pas se produire.

Et en ce qui concerne votre exemple avec le train, si vous avez une montre infiniment précise, votre train n'arrivera jamais exactement à l'heure.

sens à sens
la source
Vous dites "vous n'atteindrez jamais le point zéro", mais que pouvez-vous dire du point que j'ai touché lors de mon premier lancer de fléchettes? Soit le point que j'ai touché. Avant de lancer ma fléchette, vous auriez dit "vous ne toucherez jamais le point ", mais je viens de le frapper. Maintenant quoi? xxx
geofflittle
Je pense que vous devez faire la différence entre la question: quelle est la probabilité que je frappe un certain point? Si nous convenons que vous lancez toujours une fléchette et qu'elle frappe toujours quelque part le long de la ligne, cette probabilité est de 1. De plus, je ne dis pas seulement que vous n'atteindrez pas 0. Je dis que la probabilité que vous frappiez N'IMPORTE QUEL point que vous choisissez AVANT de lancer la fléchette est 0. En fait, vous pouvez choisir n'importe quel ensemble fini de points et la probabilité sera toujours 0.
signifiant
En ce qui concerne votre question, je comprends votre point de vue, mais poser des questions sur les probabilités des événements après leur occurrence n'est pas sensible. Une déclaration telle que P (X = x) fait référence à la réalisation future d'une variable aléatoire X. Donc, APRÈS avoir touché un point, je ne dirai rien à ce sujet. (grandes majuscules utilisées juste pour signaler le flux de temps, pas pour crier…)
signifiant
1

Une distribution de probabilité doit avoir une zone d'unité. Si la mesure est continue, il y a un nombre infini de valeurs qu'elle peut prendre (c'est-à-dire un nombre infini de valeurs le long de l'axe x de la distribution). La seule façon dont l'aire totale de la distribution de probabilité peut être finie est que la valeur à chacun des nombres infinis de valeurs soit nulle. Un divisé par l'infini.

Dans la `` vraie vie '', il ne peut y avoir de mesures qui prennent un nombre infini de valeurs (par plusieurs arguments philosophiques différents qui n'ont pas beaucoup d'importance ici), donc aucune valeur n'a besoin de prendre une probabilité d'exactement zéro. Un argument pratique utile est basé sur la précision finie des mesures du monde réel. Si vous utilisez un chronomètre mesurant au dixième de seconde, le train disposera d'un dixième de seconde pour arriver en «exactement» cinq minutes.

Michael Lew
la source
3
Le premier paragraphe ici fournit une vague intuition, bien que les étapes déductives soient incorrectes. Il existe de nombreuses distributions qui admettent un nombre infini de valeurs, mais chaque valeur a une probabilité strictement positive. Le deuxième paragraphe pourrait bénéficier d'une reformulation qui souligne qu'à chaque valeur de mesure est associée un (petit) intervalle de valeurs possibles de la quantité sous-jacente d'intérêt.
Cardinal
Quelle est la différence entre une valeur strictement positive (d'une valeur finie divisée par l'infini?) Et zéro dans ce contexte?
Michael Lew
2
Mon argument, probablement mal formulé, est que l'argument du premier paragraphe est basé sur la fausse prémisse selon laquelle, comme la variable aléatoire peut prendre une infinité de valeurs, chaque résultat individuel doit avoir une probabilité nulle. C'est, bien sûr, incorrect (Poisson, géométrique, etc.); le concept de "l'infini" n'est pas assez fort ici, nous avons besoin d' indénombrables .
cardinal
0

D'autres personnes ont répondu pourquoi la probabilité est nulle (si vous estimez que le temps est continu, ce qui n'est effectivement pas le cas , mais de toute façon ...), je vais donc l'écho brièvement. Pour répondre à la dernière question posée par le PO --- "comment cela pourrait-il se produire s'il avait une probabilité de 0?" --- des tas de choses peuvent se produire s'ils ont une probabilité nulle. Tout un ensemble de probabilités zéro signifie que, dans l'espace des choses possibles qui pourraient arriver, l'ensemble prend pas de place. C'est tout. Ce n'est pas plus significatif que cela.AA

J'écris ceci pour, je l'espère, aborder autre chose que le PO a dit dans les commentaires:

Vous dites "vous n'atteindrez jamais le point zéro", mais que pouvez-vous dire du point que j'ai touché lors de mon premier lancer de fléchettes? Soit 𝑥 le point que je frappe. Avant de lancer ma fléchette, vous auriez dit "vous n'atteindrez jamais le point 𝑥", mais je viens de le frapper. Maintenant quoi?

C'est une très bonne question et une question avec laquelle j'ai commencé à me renseigner sur la probabilité. Voici la réponse: elle n'est pas équivalente à la question que vous avez posée à l'origine! Ce que vous avez fait, c'est apporter du temps dans l'analyse, ce qui signifie que la structure de probabilité sous-jacente change pour devenir beaucoup plus complexe. Voici ce que vous devez savoir. Un espace de probabilité compose de trois choses: un espace sous-jacent , tel que ou ; un ensemble de tous les résultats possibles sur cet espace, comme l'ensemble de tous les intervalles semi-ouverts sur , et une mesure qui satisfait(Ω,A,μ)ΩRZRμμ(Ω)=1. Votre problème d'origine réside dans l'espace où est la mesure de Lebesgue (cela signifie que ). Dans cet espace, la probabilité que vous atteigniez un seul point est nulle pour les raisons décrites ci-dessus --- Je pense que nous avons clarifié cela. Mais maintenant, lorsque vous dites des choses comme le passage cité ci-dessus, vous définissez quelque chose appelé une filtration , que nous écrirons comme . Une filtration en général est une collection de sous-ensembles de qui satisfont pour tous les([a,b],all half open intervals on [a,b],ν)νν([c,d))=1dcx[a,b]F={Ft}t0AFF={Ft}t0AFtFst<s. Dans votre cas, nous pouvons définir la filtration Maintenant, dans ce nouveau sous-ensemble de votre espace de résultats, devinez quoi --- vous avez raison! Vous l'avez atteint et, après votre premier lancer, votre probabilité d'avoir atteint ce point lorsqu'il est limité à la filtration est de 1.

Ft={x[a,b]:dart hit x at time t<t}.
F1


la source
Parce que vous utilisez un langage technique, il serait préférable d'employer des significations standard pour les termes. En particulier, ce que vous appelez un «résultat» est généralement appelé un événement (de base) : les résultats sont les éléments de Votre formule pour la mesure de Lebesgue (normalisée) est incorrecte: je suppose que vous vouliez À un niveau plus fondamental, il n'est pas clair pourquoi vous devez invoquer la machinerie des processus stochastiques afin de discuter d'une variable aléatoire modélisant le temps d'un événement unique, et il n'est pas évident que cela donne un aperçu. ν ( [ c , d ] ) = ( d - c ) / ( b - a ) .Ω.ν([c,d])=(dc)/(ba).
whuber