J'essaie de sauter de l'idée d'un centile, disons, sur la ligne du nombre réel (où le nième centile est simplement la position dans laquelle n% des points de données sont en dessous et 100 à n% au-dessus) ), à l'idée de l'aire sous une fonction de densité de probabilité.
Si je veux connaître le 50% centile à partir d'un ensemble de nombres, je trouverai le point où la moitié des nombres sont en dessous, la moitié des nombres sont au-dessus. C'est le 50%, et j'ai terminé.
Si je veux connaître le centile à 50% d'une distribution, disons un score Z, j'évaluerai le cdf de 0 à 50, et j'ai terminé. Suis-je en train de dire cela correctement?
Cela me semble intuitif, mais j'ai besoin de quelques discussions pour le marteler. Ou, je pourrais être complètement hors tension ...
la source
Non. Essentiellement, le calcul d'un centile (ou d'un p-quantile) équivaut à trouver l'inverse d'un CDF.
Notez que l'inverse, au sens habituel, d'un CDF peut ne pas exister et la notion d'inverse généralisé doit être introduite. Pour rendre la discussion précise, nous clarifions toutes les définitions.
Définition: Un CDF est une fonction qui remplit les conditions suivantes:F:[−∞,∞]→[0,1]
(Augmentation) Pour tout , si , alors ,x,y∈[−∞,∞] x<y F(x)≤F(y)
(Continuité à droite) Pour touta∈R , nous avons ça F(a)=limx→a+F(x) ,
Nous avons au moins deux versions d'inverse généralisé de , notées et , qui sont définies comme suit.F Inv1F Inv2F
Ici, nous adoptons la convention que .inf(∅)=∞
Si je me souviens bien, étant donné , le -quantile est simplement défini comme .p∈[0,1] p Inv1F(p)
Bien sûr, si est strictement croissant et continu, les deux versions de l'inverse généralisé sont les mêmes et se réduisent à l'inverse habituel de la fonctionF F−1:[0,1]→[−∞,∞].
Pour plus d'informations: https://people.math.ethz.ch/~embrecht/ftp/generalized_inverse.pdf
la source