Propriétés d'une variable aléatoire discrète

11

Mon cours de statistiques m'a juste appris qu'une variable aléatoire discrète a un nombre fini d'options ... Je ne l'avais pas réalisé. J'aurais pensé, comme un ensemble d'entiers, qu'il pourrait être infini. La recherche sur Google et la vérification de plusieurs pages Web, dont quelques-unes de cours universitaires, n'ont pas réussi à le confirmer spécifiquement; la plupart des sites disent cependant que les variables aléatoires discrètes sont dénombrables - je suppose que cela signifie un nombre fini?

Il est clair que les variables aléatoires continues sont infinies même si (la plupart?) Sont souvent bornées.

Mais si les variables aléatoires discrètes ont des possibilités finies, quelle est alors une distribution infinie d'entiers? Ce n'est ni discret ni continu? La question est-elle théorique parce que les variables ont tendance à être continues et (par définition) infinies ou discontinues et finies?

James
la source
10
Vous devriez demander à votre cours de statistiques sur les variables géométriques et aléatoires de poisson
Probabilogic
C'est en ligne, donc peu de commentaires. Vous suggérez qu'il s'agit d'un troisième (et quatrième?) Type de variable, plutôt que de (!) Distributions?
James
4
Une distribution n'est pas une variable aléatoire - et ignorer cette distinction en a dérouté beaucoup. Un beau théorème des mathématiques du début du XXe siècle, le théorème de décomposition de Lebesgue , montre comment concevoir toutes les fonctions de distribution en trois types distincts: "continu" (qui sont ensuite subdivisés en absolument continus et continus mais pas en courant alternatif) et "discrets". "
whuber
2
pas un bon cours que vous prenez, j'ai peur
Aksakal
À toutes les réponses ici, merci (même si certaines sont au-dessus de ma tête, je l'avoue). Je devrais probablement me référer à ce qui a déclenché cette question, car en l'examinant, je l'ai peut-être mal interprétée: une question vraie / fausse indiquant "Une variable aléatoire discrète peut prendre un nombre fini de valeurs distinctes" est considérée comme vraie; avec l'explication que l'énoncé "est l'une des propriétés clés d'une variable aléatoire discrète". Si nous interrogions les agriculteurs pour leur demander combien de bovins ils possédaient, il serait impossible de limiter le nombre à l'avance, c'est théoriquement infini mais discret ...?
James

Réponses:

15

Si c'est ce que votre cours a dit, c'est faux.

Bien que les distributions discrètes puissent avoir un nombre fini de résultats possibles, elles ne sont pas tenues de le faire; vous pouvez avoir une distribution discrète qui a un nombre infini de résultats possibles - le nombre d'éléments ne doit pas être plus que dénombrable.

Un exemple courant serait une distribution géométrique; considérez le nombre de lancers d'une pièce équitable jusqu'à ce que vous obteniez une tête. Il n'y a pas de limite supérieure finie sur le nombre de lancers qui peuvent être nécessaires. Il peut prendre 1 lancer, ou 2, ou 3, ou 100, ou tout autre numéro.

Une distribution discrète pourrait être négative (considérez la différence entre deux de ces variables aléatoires géométriquement distribuées; il peut s'agir de n'importe quel entier positif ou négatif).

Une distribution discrète n'a pas besoin d'être sur les entiers, cependant, comme dans mon exemple. C'est juste une situation courante, pas une exigence.

Glen_b -Reinstate Monica
la source
Quelle est donc la condition réelle qui rend une distribution "discrète"? :)
Matthew Drury
La condition est qu'il ait la mesure de Lebesgue nulle, n'est-ce pas, @matthewDrury ?. Ce qui à son tour équivaut à la distribution sommant à un au plus un ensemble dénombrable.
Therkel
Je dois admettre que je ne connais pas les définitions canoniques. Je suis curieux de voir le rôle des points d'accumulation dans tout cela.
Matthew Drury
1
@Therkel Je pense qu'une distribution sur l'ensemble Cantor ne serait pas considérée comme "discrète".
Accumulation
Après avoir vérifié en.wikipedia.org/wiki/Countable_set, je suis heureux d'accepter cela comme réponse; l'exemple de la distribution géométrique est clair, et il semble représenter le consensus des réponses apportées jusqu'à présent.
James
5

J'écris une réponse, avec la perspective que je n'ai qu'une compréhension très naïve de la probabilité théorique de la mesure (alors, experts, veuillez me corriger!).

Une variable aléatoire (à valeur réelle) est une fonction , où S est un espace échantillon.X:SRS

est discret si X ( S ) , l'image de S induite par X , est dénombrable. X est continu si X a unCDF absolument continu. (Je ne sais pas grand-chose sur les fonctions absolument continues, donc je ne peux pas m'étendre sur ce point.)XX(S)SXXX

Cependant, toutes les variables aléatoires ne sont pas uniquement discrètes ou continues. Il existe des variables aléatoires "mixtes", où a un CDF qui est la somme d'une fonction échelon et d'une fonction continue avec des indicateurs.X(s)

Vous pouvez également avoir des variables aléatoires qui ne sont ni discrètes ni continues, comme la distribution de Cantor .

Clarinettiste
la source
1
En fait, vous en savez beaucoup sur les distributions absolument continues, car (presque par définition) une distribution absolument continue est une distribution qui a une densité. Il existe des distributions continues qui n'ont pas de densités: l'exemple archétypal est la distribution induite par la fonction de Cantor .
whuber
Si l'image dénombrable a un point d'accumulation, dirions-nous toujours qu'elle est discrète?
Matthew Drury
1
@Matthew Oui. L'exemple que j'ai mentionné dans un autre commentaire ( stats.stackexchange.com/a/104018/919 ), qui est clairement discret (chacune d'un nombre dénombrable de valeurs a une probabilité non nulle, donc sa fonction de distribution ne se compose que de sauts) n'a l'intervalle entier pour son ensemble de points d'accumulation. [0,1]
whuber
3

Pour citer la page wikipedia sur les variables continues et discrètes :

Si elle [la variable] peut prendre deux valeurs réelles particulières de sorte qu'elle peut également prendre toutes les valeurs réelles entre elles (même les valeurs arbitrairement rapprochées), la variable est continue dans cet intervalle

Par conséquent, une variable aléatoire discrète n'a pas besoin d'avoir un «nombre fini d'options», mais il doit y avoir un écart non infinitésimal entre les valeurs possibles. C'est le cas avec une distribution d'entiers, car la «distance» entre deux entiers voisins est 1 et ne peut pas être inférieure à cela. Par conséquent, la variable n'est pas continue car elle ne «continue» pas dans ces écarts.

Edit: Je sais qu'il y a probablement des façons meilleures et / ou plus précises de répondre à cela, mais c'est ce qui m'a aidé personnellement à comprendre la différence.

deemel
la source
4
Juste pour info, pour l'intuition, la caractérisation de Wikipédia est peut-être OK, mais pour la plupart des autres raisons, elle n'est pas correcte. Un aspect important de la "variable aléatoire continue" qu'elle omet (sur plusieurs) est qu'elle dépend des probabilités de ses valeurs, et pas seulement de l'ensemble de valeurs qu'elle peut atteindre. Votre caractérisation de l'écart "non infinitésimal" est malheureusement incorrecte. Je donne un contre-exemple sur stats.stackexchange.com/a/104018/919 montrant une variable discrète qui attribue des probabilités positives à tous les nombres rationnels entre et 1.01.
whuber
1
Certains auteurs ont déclaré que les valeurs qui se rapprochent arbitrairement ne sont pas discrètes, mais je dois admettre que je trouve cela étrange (bien que je manque peut-être quelque chose). Un exemple est la distribution de la différence des racines carrées de deux variables aléatoires de Poisson (avec de vraies applications: les gens prennent parfois des racines carrées avec des variables considérées comme Poisson pour stabiliser la variance et peuvent être intéressés à savoir si les différences de paires sont centrées sur zéro). Les valeurs peuvent être arbitrairement proches avec une telle variable mais elles sont toujours distinctes (vous pouvez les énumérer chacune), ... ctd
Glen_b -Reinstate Monica
Oui=1/XXε>0XOui
2
UNEUNE
1
Je suppose que c'est un mélange que j'avais dans ma tête. Je suis un topologue formé, donc discret sonne définitivement dans le contexte topologique quand je l'entends. Merci d'avoir clarifié @whuber.
Matthew Drury