Aidez-moi à comprendre la fonction quantile (CDF inverse)

26

Je lis sur la fonction quantile, mais ce n'est pas clair pour moi. Pourriez-vous fournir une explication plus intuitive que celle fournie ci-dessous?

Puisque le cdf est une fonction augmentant de façon monotone, il a un inverse; notons ceci par . Si est le cdf de , alors est la valeur de telle que ; Ceci est appelé le quantile de . La valeur est la médiane de la distribution, avec la moitié de la masse de probabilité à gauche et la moitié à droite. Les valeurs et sont les quartiles inférieur et supérieur.F - 1 F X F - 1 ( α ) x α P ( X x α ) = α α F F - 1 ( 0,5 ) F - 1 ( 0,25 ) F - 1 ( 0,75 )FF1FXF1(α)xαP(Xxα)=ααFF1(0.5)F1(0.25)F1(0.75)

Inder Gill
la source
Vous devriez apprendre à utiliser le balisage mathématique, voir mes modifications!
kjetil b halvorsen
6
Il s'agit d'un modèle d'explication concise à un certain niveau et contient déjà un exemple. On ne sait pas quel niveau d'explication vous cherchez. Une réponse pourrait être 10 fois plus longue en fonction de ce que vous ne savez pas. Par exemple, savez-vous qu'un cdf est? savez-vous ce que signifie «augmenter de façon monotone»? savez-vous ce qu'est une fonction inverse? Nous ne sommes qu'à mi-chemin de la première phrase. Votre question équivaut à une affirmation que vous ne comprenez pas (tout) cela et même si nous n'avons aucune raison de douter de vous, ce n'est pas du tout une question précise.
Nick Cox

Réponses:

39

Tout cela peut sembler compliqué au début, mais il s'agit essentiellement de quelque chose de très simple.

Par fonction de distribution cumulative, nous désignons la fonction qui renvoie des probabilités que soit inférieur ou égal à une valeur ,Xx

Pr(Xx)=F(x).

Cette fonction prend comme entrée x et renvoie les valeurs de l' intervalle [0,1] (probabilités) - les let les indiquent comme p . L' inverse de la fonction de distribution cumulative (ou fonction quantile) vous indique ce que x ferait que F(x) renvoie une valeur p ,

F1(p)=x.

Ceci est illustré dans le diagramme ci-dessous qui utilise la fonction de distribution cumulative normale (et son inverse) comme exemple.

entrez la description de l'image ici

Exemple

À titre d'exemple simple, vous pouvez prendre une distribution Gumbel standard . Sa fonction de distribution cumulée est

F(x)=eex

et elle peut être facilement inversée: la fonction de rappel du logarithme naturel est l'inverse de la fonction exponentielle , il est donc instantanément évident que la fonction quantile pour la distribution de Gumbel est

F-1(p)=-ln(-ln(p))

Comme vous pouvez le voir, la fonction quantile, selon son autre nom, "inverse" le comportement de la fonction de distribution cumulative.

Fonction de distribution inverse généralisée

Toutes les fonctions n'ont pas d'inverse. C'est pourquoi la citation à laquelle vous faites référence dit "fonction augmentant monotone". Rappelons qu'à partir de la définition de la fonction , elle doit affecter à chaque valeur d'entrée exactement une sortie. Les fonctions de distribution cumulative pour les variables aléatoires continues satisfont à cette propriété car elles augmentent de façon monotone. Pour les variables aléatoires discrètes, les fonctions de distribution cumulative ne sont pas continues et croissantes, nous utilisons donc des fonctions de distribution inverse généralisées qui doivent être non décroissantes. Plus formellement, la fonction de distribution inverse généralisée est définie comme

F-1(p)=inf{XR:F(X)p}.

La définition, traduite en anglais simple, dit que pour une valeur de probabilité donnée , nous recherchons un certain , ce qui entraîne une valeur de retour supérieure ou égale à , mais comme il pourrait y avoir plusieurs valeurs de qui répondent à cette (par exemple est vrai pour tout ), nous prenons donc le plus petit de ceux-ci.pXF(X)pXF(X)0x x XX

Fonctions sans inverses

En général, il n'y a pas d'inverses pour les fonctions qui peuvent renvoyer la même valeur pour différentes entrées, par exemple les fonctions de densité (par exemple, la fonction de densité normale standard est symétrique, elle renvoie donc les mêmes valeurs pour et etc.). La distribution normale est un exemple intéressant pour une raison supplémentaire: c'est l'un des exemples de fonctions de distribution cumulative qui n'ont pas d'inverse de forme fermée . Toutes les fonctions de distribution cumulative ne doivent pas nécessairement avoir une inverse de forme fermée ! Espérons que dans de tels cas, les inverses peuvent être trouvées en utilisant des méthodes numériques.-22

Cas d'utilisation

La fonction quantile peut être utilisée pour la génération aléatoire comme décrit dans Comment fonctionne la méthode de transformation inverse?

Tim
la source
2
Cette réponse fonctionne bien jusqu'à l'avant-dernier paragraphe. Au moment où vous y arrivez, vous avez affirmé que chaque CDF continu a un inverse mais vous semblez avoir proposé la distribution normale comme contre-exemple à cette même déclaration. C'est potentiellement très déroutant.
whuber
2
@whuber vous avez raison, a ajouté une phrase pour le rendre plus clair.
Tim
2
Tim, et j'ai ajouté un mot de plus pour le rendre encore plus clair :)
amibe dit Reinstate Monica
@Tim excellente réponse mais pourriez-vous nous éclairer sur la définition du cdf inverse ? Comme vous l'avez mentionné, nous demandons ce que ferait . Je comprends la partie comme suit. Étant donné que le cdf est monotone croissant, il existe de nombreuses valeurs satisfaisant toutes mais le donnerait la borne inférieure la plus grande, c'est-à-dire fixer un point unique et définir ainsi l'inverse généralisé. Est-ce que ça a du sens ? x F ( x ) = p inf F ( x ) u infF-1(u)=inf{X:F(X)u}XF(X)=pinfF(X)uinf
Alexander Cska
@AlexanderCska Oui, fondamentalement, plusieurs valeurs F (x) sont supérieures à u, nous prenons donc la borne inférieure, "la plus petite valeur qui remplit cette condition".
Tim
1

Tim a eu une réponse très complète. Bon travail!

Je voudrais ajouter une dernière remarque. Toutes les fonctions à croissance monotone n'ont pas de fonction inverse. En fait, seules les fonctions strictement croissantes / décroissantes monotones ont des fonctions inverses.

Pour les cdf à augmentation monotone qui ne sont pas strictement à croissance monotone, nous avons une fonction quantile qui est également appelée fonction de distribution cumulative inverse. Vous pouvez trouver plus de détails ici .

Les fonctions inverses (pour celles qui augmentent strictement le cdf) et les fonctions quantiles (pour celles qui augmentent monotone mais pas strictement les augmentations cdot) peuvent être notées , ce qui peut parfois prêter à confusion.F1

Tingguang Li
la source