Quelqu'un peut-il clarifier le concept d'une «somme de variables aléatoires»

21

Dans ma classe de probabilité, les termes «sommes de variables aléatoires» sont constamment utilisés. Cependant, je suis coincé sur ce que cela signifie exactement?

Parlons-nous de la somme d'un tas de réalisations à partir d'une variable aléatoire? Si oui, cela ne correspond-il pas à un seul numéro? Comment une somme de réalisations de variables aléatoires nous conduit-elle à une distribution, ou à une fonction cdf / pdf / de quelque nature que ce soit? Et s'il ne s'agit pas de réalisations de variables aléatoires, qu'est-ce qui est ajouté exactement?

Gosset
la source
1
Par «réalisations d'une variable aléatoire», je suppose que vous entendez les valeurs réelles observées. Ce qui est résumé dans la «somme des variables aléatoires», ce sont les variables aléatoires avant qu'elles ne soient observées. Imaginez le calcul du poids des 5 prochaines personnes pour monter dans l'ascenseur. Vous ne connaissez pas (encore) leur poids et ils sont donc chacun une variable aléatoire. Mais vous aimeriez probablement savoir quelque chose sur la distribution de la somme de leurs poids.
PeterR
@PeterR C'est ce que je ne comprends pas. Comment est-il même logique de parler d'ajouter quelque chose qui n'a pas encore de valeur? Est-ce un type de sommation métaphorique?
Gosset
1
Je pense que votre problème est que vous ne comprenez pas ce qu'est une variable aléatoire. Si vous obtenez ce concept, la somme viendra facilement aussi.
Aksakal
@Aksakal N'est-ce pas le fait que j'ai déjà posté cette question? Peut-être que si vous le savez, vous pourriez clarifier le concept?
Gosset
De bonnes réponses ont été données. Un autre bon exemple est la somme de deux dés, . Le résultat est clairement aléatoire (vous ne savez pas à l'avance quelle sera la somme des deux dés). Nous savons que et indépendant. Il s'avère que a une distribution triangulaire. X , Y U n i fX+YX + YX,YUnif(1,6)X+Y
bdeonovic

Réponses:

39

Un modèle physique et intuitif d'une variable aléatoire consiste à noter le nom de chaque membre d'une population sur une ou plusieurs feuilles de papier - «tickets» - et à mettre ces tickets dans une boîte. Le processus consistant à mélanger soigneusement le contenu de la boîte, puis à retirer aveuglément un ticket - exactement comme dans une loterie - modélise l'aléatoire. Les probabilités non uniformes sont modélisées en introduisant un nombre variable de tickets dans la boîte: plus de tickets pour les membres les plus probables, moins pour les moins probables.

Une variable aléatoire est un nombre associé à chaque membre de la population. (Par conséquent, par souci de cohérence, chaque ticket pour un membre donné doit porter le même numéro.) Plusieurs variables aléatoires sont modélisées en réservant des espaces sur les tickets pour plusieurs numéros. Nous donnons habituellement les noms des espaces tels et . La somme de ces variables aléatoires est la somme habituelle: réserver un nouvel espace sur chaque ticket pour la somme, lire les valeurs de etc. sur chaque ticket, et écrire leur somme dans ce nouvel espace. C'est une façon cohérente d'écrire des nombres sur les tickets, c'est donc une autre variable aléatoire.Y , Z X , Y ,X, Y,ZX, Y,

Figure

Ce chiffre représente une boîte représentant une population et trois variables aléatoires , et . Il contient six tickets: les trois pour (bleu) lui donnent une probabilité de , les deux pour (jaune) lui donnent une probabilité de , et celui pour (vert) lui donne une probabilité de . Afin d'afficher ce qui est écrit sur les tickets, ils sont affichés avant d'être mixés.X Y X + Y α trois / six β 2 / six γ 1 / sixΩ={α,β,γ}XOuiX+Ouiα3/6β2/6γ1/6

La beauté de cette approche est que toutes les parties paradoxales de la question s'avèrent correctes:

  • la somme des variables aléatoires est en effet un nombre unique et défini (pour chaque membre de la population),

  • mais elle conduit également à une distribution (donnée par les fréquences avec lesquelles la somme apparaît dans la case), et

  • il modélise toujours efficacement un processus aléatoire (car les tickets sont toujours tirés à l'aveugle de la boîte).

De cette façon, la somme peut avoir simultanément une valeur définie (donnée par les règles d'addition appliquées aux numéros sur chacun des billets) tandis que la réalisation - qui sera un billet tiré de la boîte - n'a de valeur que il est réalisé.

Ce modèle physique de tirage de tickets à partir d'une boîte est adopté dans la littérature théorique et rendu rigoureux avec les définitions de l'espace d'échantillon (la population), les algèbres sigma (avec leurs mesures de probabilité associées) et les variables aléatoires en tant que fonctions mesurables définies sur l'espace d'échantillon .

Ce compte rendu des variables aléatoires est élaboré, avec des exemples réalistes, à "Qu'entend-on par une variable aléatoire?" .

whuber
la source
3
+1 poste exemplaire. J'espère que la question impertinente ne vous dérange pas, mais dans quoi l'illustration a-t-elle été faite?
Glen_b -Reinstate Monica
4
@Glen_b PowerPoint :-). L'image d'une boîte provient de mymiddlec.files.wordpress.com/2013/09/empty-box.jpg . Les tickets sont des graphiques PowerPoint. (Il n'y a rien d'impertinent dans de telles questions!) J'ai regroupé tout le groupe, l'ai collé dans Paint et l'ai utilisé pour l'enregistrer en tant que fichier .png.
whuber
Il me manque quelque chose, mais il semble que vous écrivez simplement plusieurs étiquettes numériques sur chaque membre de la population. Tous les alphas ont X = 1, Y = 2 et donc X + Y = 3 .. X, Y et X + Y ont exactement la même distribution, décalée d'une valeur ici à une valeur là-bas, en raison de différents niveaux
MiloMinderbinder
1
@whuber - devrait avoir des fréquences écrites. Pas bien versé dans les jargons mathématiques pour dire «mesure de probabilité sous-jacente». de toute façon vous obtenez ma dérive. Je commence à voir comment je peux jouer avec les nombres sur les billets pour lui donner la distribution de probabilité souhaitée. Au niveau superficiel, cette approche semblait être un jeu de mots avec différentes «étiquettes» et ne la voyait donc pas clairement. ce serait comme la 50e fois que vous m'aidiez sur ce site. merci
MiloMinderbinder
1
@Milo Vous êtes les bienvenus. Je vois maintenant que vous réagissiez à l'exemple de cette réponse plutôt qu'à l'exemple que j'ai donné dans les commentaires précédents. L'exemple de la réponse a en effet trois tickets différents avec des fréquences relatives 1: 2: 3, et c'est tout ce que signifie "mesure de probabilité" dans ce cas. Ce n'est pas seulement du jargon, cependant: il y a un besoin profond pour les concepts sous-jacents. Voir, entre autres, stats.stackexchange.com/questions/199280 pour quelques bons comptes.
whuber
4

il n'y a pas de secret derrière cette phrase, c'est aussi simple que vous pouvez le penser: si X et Y sont deux variables aléatoires, leur somme est X + Y et cette somme est également une variable aléatoire. Si X_1, X_2, X_3, ..., X_n et sont n variables aléatoires, leur somme est X_1 + X_2 + X_3 + ... + X_n et cette somme est également une variable aléatoire (et la réalisation de cette somme est une seule nombre, soit une somme de n réalisations).

Pourquoi parlez-vous autant de sommes de variables aléatoires dans la classe? Une des raisons est le théorème de limite centrale (étonnant): si nous additionnons de nombreuses variables aléatoires indépendantes, alors nous pouvons "prédire" la distribution de cette somme (presque) indépendamment de la distribution des variables uniques dans la somme! La somme tend à devenir une distribution normale et c'est probablement la raison pour laquelle nous observons la distribution normale si souvent dans le monde réel.

jolvi
la source
3

rv est une relation entre l'occurrence d'un événement et un nombre réel. Disons que s'il pleut, la valeur X est 1, si ce n'est pas le cas alors 0. Vous pouvez avoir un autre RV Y égal à 10 quand il fait froid et 100 quand il fait chaud. Donc, s'il pleut et qu'il fait froid, alors X = 1, Y = 10 et X + Y = 11.

Les valeurs X + Y sont 10 (pas de pluie froide); 11 (pleut, froid), 100 (ne pleut pas, chaud) et 110 (pleut, chaud). Si vous calculez nos probabilités des événements, vous obtiendrez alors la PMF de ce nouveau VR X + Y.

Aksakal
la source
1

X,OuiX+OuiΩ1×Ω2X,OuiΩ={Heune,Tunejel}X(Heune)=Oui(Heune)=1,X(Tunejel)=Oui(Tunejel)=0(X+Oui)X,Ouiσ-X,Oui

Daniel Li
la source