Le problème vient de la page 377-379 de ce document [0] .
Étant donné une distribution continue et un fixe , considérons:
et
où est l'inverse continu droit. Donc, pour un z fixe , c'est la distance médiane de tous les Z \ sim F à z . Ensuite, considérez la fonction:
Maintenant, je n'ai pas d'expression analytique pour (en fait, je suis sûr qu'une expression analytique n'est pas possible) mais étant donné un CDF je peux facilement utiliser un algorithme de recherche de racine pour obtenir pour tout z donné .
Dans cette application, l'intérêt porte sur:
Ceci est la valeur médiane de la , encore une fois, pour .
En ce moment pour obtenir , je calcule (comme expliqué ci-dessus, en utilisant un algorithme de recherche de racine) des valeurs de correspondant à de nombreuses valeurs de sur une grille et je prends la médiane pondérée de ces valeurs de (avec les poids ) comme mon estimation de .
Mes questions sont:
- Existe-t-il une approche plus précise pour obtenir (les auteurs de l'article ne disent pas comment est calculé) et
Comment choisir la grille de valeurs de ?
[0] Ola Hössjer, Peter J. Rousseeuw et Christophe Croux. Asymptotique d'un estimateur d'une fonction de propagation robuste. Statistica Sinica 6 (1996), 375-388.
Réponses:
Nous pouvons donc simplifier votre expression:
Je pense que c'est un problème d'optimisation à deux niveaux , que je ne connais pas trop mais peut-être qu'il existe des techniques standard que vous pouvez appliquer. Là encore, cela pourrait ne pas être plus rapide que de simplement calculer la médiane de l'échantillon des médianes pour des échantillons plus grands jusqu'à la convergence.
la source
Une approche directe fondée sur les données pour estimer la fonction quantile consiste à:
ecdf
fonction dans R). L'inverse du CDF n'est rien d'autre que la fonction quantile (quantile
fonction dans R). Voir ici pour obtenir les valeurs et tracer votre fonction quantile. Vous pouvez même obtenir des bandes de confiance.Une condition préalable est cependant que vous échantillonnez des fonctionnalités suffisamment d'observations pour au moins avoir une bonne idée de la forme de votre PDF sous-jacent.
la source
Donc, je pense que la meilleure façon d’obtenir
est de:
la source