Supposons que soit une variable aléatoire avec pdf f X ( x ) . Alors la variable aléatoire Y = X 2 a le pdf
Je comprends le calcul derrière cela. Mais j'essaie de trouver un moyen de l'expliquer à quelqu'un qui ne connaît pas le calcul. En particulier, j'essaie d'expliquer pourquoi le facteur apparaît devant. Je vais tenter le coup:
Supposons que ait une distribution gaussienne. Presque tout le poids de son pdf est entre les valeurs, par exemple, et Mais que les cartes à 0 à 9 pour . Ainsi, le poids lourd dans le pdf pour a été étendue à travers une gamme plus large de valeurs dans la transformation à . Ainsi, pour que soit un véritable pdf, le poids très lourd doit être réduit du facteur multiplicatif
Comment ça sonne?
Si quelqu'un pouvait fournir une meilleure explication ou un lien vers celui d'un document ou d'un manuel, je l'apprécierais beaucoup. Je trouve cet exemple de transformation variable dans plusieurs livres de statistiques mathématiques d'introduction et de probabilité. Mais je ne trouve jamais d'explication intuitive avec cela :(
la source
Réponses:
Les PDF sont des hauteurs mais ils sont utilisés pour représenter une probabilité par surface. Il est donc utile d’exprimer un fichier PDF de manière à nous rappeler que la surface est égale à la hauteur multipliée par la base.
Initialement, la hauteur pour toute valeurx est donnée par le PDF fX(x) . La base est le segment infinitésimal dx , d'où la distribution (c'est-à-dire la mesure de probabilité opposée à la fonction de distribution ) est en réalité la forme différentielle, ou "élément de probabilité".
Ceci, plutôt que le PDF, est l’objet avec lequel vous voulez travailler, tant sur le plan conceptuel que pratique, car il inclut explicitement tous les éléments. les éléments nécessaires pour exprimer une probabilité.
Lorsque nous ré-exprimonsx en termes de y=x2 , les segments de base dx sont étirés (ou pincés): en quadrillant les deux extrémités de l'intervalle de x à x+dx nous voyons que la base de la zone y doit être un intervalle de longueur
Puisque le produit de deux infinitésimaux est négligeable par rapport aux infinitésimaux eux-mêmes, nous concluons
Ceci étant établi, le calcul est trivial car il suffit de brancher la nouvelle hauteur et la nouvelle largeur:
Parce que la base, en termes dey , est dy , quel que soit le multiplie doit être la hauteur, que l' on peut lire directement sur le moyen terme comme
Cette équationPEX(x)=PEY(y) est effectivement une loi de conservation de la surface (= probabilité).
Ce graphique montre avec précision les parties étroites (presque infinitésimales) de deux PDF liés pary=x2 . Les probabilités sont représentées par les zones ombrées. En raison de la compression de l'intervalle [0.32,0.45] via la quadrature, la hauteur de la région rouge ( y , à gauche) doit être proportionnellement étendue pour correspondre à la surface de la région bleue ( x , à droite).
la source
How about, if I manufacture objects that are always square and I know the distribution of the side lengths of the squares; what can I say about the distribution of the areas of the squares?
In particular, if I know the distribution of a random variableX , what can I say about Y=X2 ? One thing that you can say is
So a relationship is established between the CDF ofY and CDF of X ; what is the relationship between their PDFs? We need calculus for that. Taking the derivatives
of both sides gives you the results you wanted.
la source
density = prob mass/interval
...what i'm getting wrong?Imagine we have a population andY is a summary of that population. Then P(Y∈(y,y+Δy)) is counting the proportion of individuals that have variable Y in the range (y,y+Δy) . You can consider this as a "bin" of size Δy and we are counting how many individuals are inside that bin.
Now let us re-express those individuals in terms of another variable,X . Given that we know that Y and X are related as Y=X2 , the event Y∈(y,y+Δy) is the same as the event X2∈(x2,(x+Δx)2) which is the same as the event X∈(|x|,|x|+Δx) or X∈(−|x|−Δx,−|x|) . Thus, the individuals that are in the bin (y,y+Δy) must also be in the bins (|x|,|x|+Δx) and (−|x|−Δx,−|x|) . In other words, those bins must have the same proportion of individuals,
Ok, now let's get to the density. First, we need to define what a probability density is. As the name suggests, it is the proportion of individuals per area. That is, we count the share of individuals on that bin and divide by the size of the bin. Since we have established that the proportions of people are the same here, but the size of the bins have changed, we conclude the density will be different. But different by how much?
As we said, the probability density is the proportion of people in the bin divided by the size of the bin, thus the density ofY is given by fY(y):=P(Y∈(y,y+Δy))Δy . Analogously, the probability density of X is given by fX(x):=P(X∈(x,x+Δx))Δx .
From our previous result that the population in each bin is the same we then have that,
That is, the densityfX(y√)+fX(−y√) changes by the factor ΔxΔy , which is the relative size of stretching or squeezing the bin size. In our case, since y=x2 we have that y+Δy=(x+Δx)2=x2+2xΔx+Δx2 . If Δx is tiny enough we can ignore Δx2 , which implies Δy=2xΔx and ΔxΔy=12x=12y√ , and that is why the factor 12y√ shows up in the transformation.
la source