Un tel estimateur n'existe pas.
L'intuition est que la médiane peut rester fixe pendant que nous déplaçons librement la densité de probabilité des deux côtés, de sorte que tout estimateur dont la valeur moyenne est la médiane d'une distribution aura une moyenne différente pour la distribution modifiée, ce qui la rend biaisée. L'exposé suivant donne un peu plus de rigueur à cette intuition.
Nous souhaitons distributions F ayant les médianes uniques m , de sorte que , par définition , F(m)≥1/2 et F(x)<1/2 pour tout x<m . Fixer une taille d'échantillon n≥1 et supposer que t:[0,1]n→[0,1] estime m . (Il suffira que tseulement être borné, mais généralement on ne considère pas sérieusement les estimateurs qui produisent des valeurs manifestement impossibles.) Nous ne faisons aucune hypothèse sur ; il n'a même pas besoin d'être continu partout.t
La signification de étant sans biais (pour cette taille d'échantillon fixe) est quet
EF[t(X1,…,Xn)]=m
pour tout échantillon iid avec . Un « estimateur sans biais » t est un avec cette propriété pour tout ce F .Xi∼FtF
Supposons qu'il existe un estimateur sans biais. Nous dériverons une contradiction en l'appliquant à un ensemble de distributions particulièrement simple. Considérons les distributions ayant ces propriétés:F=Fx,y,m,ε
;0≤x<y≤1
;0<ε<(y−x)/4
;x+ε<m<y−ε
;Pr(X=x)=Pr(X=y)=(1−ε)/2
; etPr(m−ε≤X≤m+ε)=ε
est uniforme sur [ m - ε , m + ε ] .F[m−ε,m+ε]
Ces distributions placent la probabilité à chacun de x et y et une toute petite quantité de probabilité placée symétriquement autour de m entre x et y . Cela rend m la médiane unique de F . (Si vous craignez que ce ne soit pas une distribution continue, alors convoluez-la avec une gaussienne très étroite et tronquez le résultat à [ 0 , 1 ] : l'argument ne changera pas.)(1−ε)/2xymxymF[0,1]
Maintenant, pour tout estimateur médian putatif , une estimation facile montre que E [ t ( X 1 , X 2 , … , X n ) ] est strictement à l'intérieur de ε de la moyenne des 2 n valeurs t ( x 1 , x 2 , … , X n ) où les x i varient sur toutes les combinaisons possibles de x et y . Cependant, nous pouvons varier mtE[t(X1,X2,…,Xn)]ε2nt(x1,x2,…,xn)xixymentre et y - ε , un changement d'au moins ε (grâce aux conditions 2 et 3). Il existe donc un m , et d'où une distribution correspondante F x , y , m , ε , pour laquelle cette attente n'est pas égale à la médiane, QED.x+εy−εεmFx,y,m,ε
Trouver un estimateur non biaisé sans modèle paramétrique serait difficile! Mais vous pouvez utiliser le bootstrap et l'utiliser pour corriger la médiane empirique afin d'obtenir un estimateur approximativement sans biais.
la source
I believe quantile regression will give you a consistent estimator of the median. Given the modelY=α+u . And you want to estimate med(y)=med(α+u)=α+med(u) since α is a constant. All you need is the med(u)=0 which should be true so long as you have independent draws. However, as far as unbiasedness, I don't know. Medians are difficult.
la source