Dans ma classe de probabilité, les termes «sommes de variables aléatoires» sont constamment utilisés. Cependant, je suis coincé sur ce que cela signifie exactement?
Parlons-nous de la somme d'un tas de réalisations à partir d'une variable aléatoire? Si oui, cela ne correspond-il pas à un seul numéro? Comment une somme de réalisations de variables aléatoires nous conduit-elle à une distribution, ou à une fonction cdf / pdf / de quelque nature que ce soit? Et s'il ne s'agit pas de réalisations de variables aléatoires, qu'est-ce qui est ajouté exactement?
Réponses:
Un modèle physique et intuitif d'une variable aléatoire consiste à noter le nom de chaque membre d'une population sur une ou plusieurs feuilles de papier - «tickets» - et à mettre ces tickets dans une boîte. Le processus consistant à mélanger soigneusement le contenu de la boîte, puis à retirer aveuglément un ticket - exactement comme dans une loterie - modélise l'aléatoire. Les probabilités non uniformes sont modélisées en introduisant un nombre variable de tickets dans la boîte: plus de tickets pour les membres les plus probables, moins pour les moins probables.
Une variable aléatoire est un nombre associé à chaque membre de la population. (Par conséquent, par souci de cohérence, chaque ticket pour un membre donné doit porter le même numéro.) Plusieurs variables aléatoires sont modélisées en réservant des espaces sur les tickets pour plusieurs numéros. Nous donnons habituellement les noms des espaces tels et . La somme de ces variables aléatoires est la somme habituelle: réserver un nouvel espace sur chaque ticket pour la somme, lire les valeurs de etc. sur chaque ticket, et écrire leur somme dans ce nouvel espace. C'est une façon cohérente d'écrire des nombres sur les tickets, c'est donc une autre variable aléatoire.Y , Z X , Y ,X, Oui, Z X, Oui,
Ce chiffre représente une boîte représentant une population et trois variables aléatoires , et . Il contient six tickets: les trois pour (bleu) lui donnent une probabilité de , les deux pour (jaune) lui donnent une probabilité de , et celui pour (vert) lui donne une probabilité de . Afin d'afficher ce qui est écrit sur les tickets, ils sont affichés avant d'être mixés.X Y X + Y α trois / six β 2 / six γ 1 / sixΩ = { α , β, γ} X Oui X+ Y α 3 / 6 β 2 / 6 γ 1 / 6
La beauté de cette approche est que toutes les parties paradoxales de la question s'avèrent correctes:
la somme des variables aléatoires est en effet un nombre unique et défini (pour chaque membre de la population),
mais elle conduit également à une distribution (donnée par les fréquences avec lesquelles la somme apparaît dans la case), et
il modélise toujours efficacement un processus aléatoire (car les tickets sont toujours tirés à l'aveugle de la boîte).
De cette façon, la somme peut avoir simultanément une valeur définie (donnée par les règles d'addition appliquées aux numéros sur chacun des billets) tandis que la réalisation - qui sera un billet tiré de la boîte - n'a de valeur que il est réalisé.
Ce modèle physique de tirage de tickets à partir d'une boîte est adopté dans la littérature théorique et rendu rigoureux avec les définitions de l'espace d'échantillon (la population), les algèbres sigma (avec leurs mesures de probabilité associées) et les variables aléatoires en tant que fonctions mesurables définies sur l'espace d'échantillon .
Ce compte rendu des variables aléatoires est élaboré, avec des exemples réalistes, à "Qu'entend-on par une variable aléatoire?" .
la source
il n'y a pas de secret derrière cette phrase, c'est aussi simple que vous pouvez le penser: si X et Y sont deux variables aléatoires, leur somme est X + Y et cette somme est également une variable aléatoire. Si X_1, X_2, X_3, ..., X_n et sont n variables aléatoires, leur somme est X_1 + X_2 + X_3 + ... + X_n et cette somme est également une variable aléatoire (et la réalisation de cette somme est une seule nombre, soit une somme de n réalisations).
Pourquoi parlez-vous autant de sommes de variables aléatoires dans la classe? Une des raisons est le théorème de limite centrale (étonnant): si nous additionnons de nombreuses variables aléatoires indépendantes, alors nous pouvons "prédire" la distribution de cette somme (presque) indépendamment de la distribution des variables uniques dans la somme! La somme tend à devenir une distribution normale et c'est probablement la raison pour laquelle nous observons la distribution normale si souvent dans le monde réel.
la source
rv est une relation entre l'occurrence d'un événement et un nombre réel. Disons que s'il pleut, la valeur X est 1, si ce n'est pas le cas alors 0. Vous pouvez avoir un autre RV Y égal à 10 quand il fait froid et 100 quand il fait chaud. Donc, s'il pleut et qu'il fait froid, alors X = 1, Y = 10 et X + Y = 11.
Les valeurs X + Y sont 10 (pas de pluie froide); 11 (pleut, froid), 100 (ne pleut pas, chaud) et 110 (pleut, chaud). Si vous calculez nos probabilités des événements, vous obtiendrez alors la PMF de ce nouveau VR X + Y.
la source
la source