Est-il possible d'avoir un estimateur sans biais et borné?

8

J'ai un paramètre qui se situe entre . Disons que je peux exécuter une expérience et obtenir , où est un gaussien standard. Ce dont j'ai besoin, c'est d'une estimation de qui est 1) sans biais 2) presque sûrement borné. L'exigence (2) est cruciale pour moi.θ[0,1]θ^=θ+wwθ

La pensée naturelle à faire est de construire un nouvel estimateur mettant à s'il est supérieur à et à s'il est inférieur à . Mais alors l'estimateur ne sera pas sans biais. Donc qu'est ce que je devrais faire?θ^1100

Formellement, la question est de savoir s'il existe une fonction telle que satisfait (1) et (2) ci-dessus. De plus, la situation serait-elle différente si je prélevais plus d'un seul échantillon?f:RRf(θ^)

yves
la source
Pouvez-vous nous en dire plus sur votre situation? Je ne suis pas un statisticien mathématique, mais cela me semble très abstrait. Cela me rappelle la régression logistique, où le paramètre doit se trouver dans , et , mais la distribution d'échantillonnage de n'est pas gaussienne. (Bien sûr, est, mais ce n'est pas limité par .) Est-ce que tout cela est lié à votre situation? FWIW, je soupçonne que vous ne pourrez pas trouver une fonction comme vous le souhaitez (c'est-à-dire qui est bornée), b / c n'est pas borné. (Avec mes excuses, je peux supprimer ce commentaire si nécessaire.)π(0,1)E[π^]=ππ^logit(π^)(0,1)R
gung - Réintégrer Monica
Je suis d' accord que le plus probable qu'une telle fonction existe, même si nous élargissons la condition à la collecte d' échantillons multiples. Si tel est le cas, cependant, je serais toujours intéressé à voir une preuve qu'une telle fonction n'existe pas. F
yves
2
L'expression est une expression théorique à laquelle on arrive généralement en essayant de déterminer les propriétés de l'estimateur, impartialité dans ce cas. Mais ce n'est pas la forme fonctionnelle réelle de l'estimateur, car il contient le paramètre inconnu . Afin d'explorer de manière significative votre question, nous avons besoin de l'expression de en fonction des données. Cela ne peut pas être répondu en général. θ^=θ+wθθ^
Alecos Papadopoulos
J'ai la même question! Plus précisément, la question est de savoir s'il existe et une fonction mesurable telle queJe crois que la réponse est non, mais je cherche une preuve que ce n'existe pas. -<une<b<F:R[une,b]
μ[0,1]     EXN(μ,1)[F(X)]=μ.
F
Thomas

Réponses:

3

Je présenterai les conditions dans lesquelles un estimateur sans biais reste sans biais, même après avoir été borné. Mais je ne suis pas sûr qu'ils représentent quelque chose d'intéressant ou d'utile.

Soit un estimateur θ^ du paramètre inconnu θ d'une distribution continue, et E(θ^)=θ.

Supposons que, pour certaines raisons, sous échantillonnage répété, nous voulons que l’estimateur produise des estimations [δl,δu]. Nous supposons queθ[δl,δu] et nous pouvons donc écrire quand cela est commode l'intervalle comme [θ-une,θ+b] avec {une,b} nombres positifs mais bien sûr inconnus.

Alors l'estimateur contraint est

θ^c={δlθ^<δlθ^δlθ^δuδuδu<θ^}

et sa valeur attendue est

E(θ^c)=δlP[θ^δl]+E(θ^δlθ^δu)P[δlθ^δu]+δuP[θ^>δu]

Définissez maintenant les fonctions d'indicateur

Il=I(θ^δl),Im=I(δlθ^δl),Iu=I(θ^>δu)

et notez que

(1)Il+Iu=1Im

en utilisant ces fonctions d'indicateur et intégrales, nous pouvons écrire la valeur attendue de l'estimateur contraint comme (f(θ^) est la fonction de densité de θ^),

E(θ^c)=δlf(θ^)Ildθ^+θ^f(θ^)Imdθ^+δuf(θ^)Iudθ^

=f(θ^)[δlIl+θ^Im+δuIu]dθ^

(2)=E[δlIl+θ^Im+δuIu]

En décomposant les bornes supérieure et inférieure, nous avons

E(θ^c)=E[(θa)Il+θ^Im+(θ+b)Iu]

=E[θ(Il+Iu)+θ^Im]aE(Il)+bE(Iu)

et en utilisant (1),

=E[θ(1Im)+θ^Im]aE(Il)+bE(Iu)

(3)E(θ^c)=θ+E[(θ^-θ)jem]-uneE(jel)+bE(jeu)

Maintenant, depuis E(θ^)=θ on a

E[(θ^-θ)jem]=E(θ^jem)-E(θ^)E(jem)

Mais

E(θ^Im)=E(θ^ImIm=1)E(Im)=E(θ^)E(Im)

Par conséquent, E[(θ^θ)Im]=0 et donc

(4)E(θ^c)=θaE(Il)+bE(Iu)=θaP(θ^δl)+bP(θ^>δu)

Ou bien

(4a)E(θ^c)=θ(θδl)P(θ^δl)+(δuθ)P(θ^>δu)

Par conséquent, à partir de (4), nous voyons que pour que l'estimateur contraint soit également sans biais, nous devons avoir

(5)aP(θ^δl)=bP(θ^>δu)

Quel est le problème avec la condition (5)? Il implique les nombres inconnus{a,b}, donc en pratique nous ne pourrons pas réellement déterminer un intervalle pour délimiter l'estimateur et le garder sans biais.

Mais disons qu'il s'agit d'une expérience de simulation contrôlée, où nous voulons étudier d'autres propriétés des estimateurs, étant donné l'impartialité. Ensuite, nous pouvons "neutraliser"a et b en définissant a=b, ce qui crée essentiellement un intervalle symétrique autour de la valeur de θ... Dans ce cas, pour atteindre l'impartialité, nous devons plus P(θ^δl)=P(θ^>δu), c'est-à-dire que nous devons avoir que la masse de probabilité de l' estimateur non contraint est égale à la gauche et à la droite de la (symétrique autour deθ) intervalle ...

... et nous apprenons donc que (comme conditions suffisantes), si la distribution de l'estimateur non contraint est symétrique autour de la valeur vraie, alors l'estimateur contraint dans un intervalle symétrique autour de la valeur vraie sera également non biaisé ... mais c'est presque trivialement évident ou intuitif, n'est-ce pas?

Cela devient un peu plus intéressant, si nous réalisons que la condition nécessaire et suffisante (étant donné un intervalle symétrique) a) ne nécessite pas une distribution symétrique , seulement une masse de probabilité égale "dans la queue" (et cela n'implique pas à son tour que le la distribution de la masse dans chaque queue doit être identique) et b) permet qu'à l'intérieur de l'intervalle, la densité de l'estimateur puisse avoir n'importe quelle forme non symétrique compatible avec le maintien de l'impartialité - cela rendra l'estimateur contraint sans biais.

APPLICATION: Le cas du PO
Notre estimateur estθ^=θ+w,wN(0,1) et donc θ^N(θ,1). Ensuite, en utilisant(4) en écrivant a,b en terme de θ,δ, nous avons, pour l'intervalle de délimitation [0,1],

E[θ^c]=θθP(θ^0)+(1θ)P(θ^>1)

La distribution est symétrique autour θ. Transformer (Φ() est le CDF normal standard)

E[θ^c]=θ-θP(θ^-θ-θ)+(1-θ)P(θ^-θ>1-θ)

=θ-θΦ(-θ)+(1-θ)[1-Φ(1-θ)]

On ne peut vérifier que les conditions supplémentaires ne s’annulent que si θ=1/2, à savoir uniquement si l'intervalle de délimitation est également symétrique autour de θ.

Alecos Papadopoulos
la source
Je ne pense pas que cela réponde à la question. Vous analysez la troncature. La question n'est pas "La troncature fonctionne-t-elle?", Mais plutôt "Existe-t-il une alternative à la troncature qui fonctionne?". OP semble être conscient que la troncature ne fonctionne pas.
Thomas
@Thomas L'OP demande (dernière phrase du post de l'OP) si nous pouvons avoir un estimateur borné qui est également non biaisé. Je présente d'abord un traitement général de la question puis une application directement dans les locaux du PO. Je ne comprends pas pourquoi cela "ne répond pas à la question".
Alecos Papadopoulos
Vous supposez une forme fonctionnelle spécifique pour l'estimateur, à savoir
F(θ^)={δlθ^<δlθ^δlθ^δuδuδu<θ^}
pour certains δl,δuR. Mon interprétation est que la question porte sur tout estimateur bornéF, pas seulement des estimateurs avec cette forme fonctionnelle. Par exemple,F(θ^)=péché(θ^)serait un estimateur borné (mais pas utile cependant).
Thomas
(Je commente cette question vieille de plusieurs années parce que j'ai la même question. En particulier, la question qui m'intéresse concerne les estimateurs bornés arbitrairement.)
Thomas
@Thomas Il est vrai que mes explorations ne traitent pas le bornage dans sa plus grande généralité. Il est également vrai qu'une fois que vous avez composé l'estimateur avec une fonction non linéaire, il doit en général être biaisé, comme condition nécessaire pour que la transformation ne soit pas biaisée.
Alecos Papadopoulos