J'ai un paramètre qui se situe entre . Disons que je peux exécuter une expérience et obtenir , où est un gaussien standard. Ce dont j'ai besoin, c'est d'une estimation de qui est 1) sans biais 2) presque sûrement borné. L'exigence (2) est cruciale pour moi.
La pensée naturelle à faire est de construire un nouvel estimateur mettant à s'il est supérieur à et à s'il est inférieur à . Mais alors l'estimateur ne sera pas sans biais. Donc qu'est ce que je devrais faire?
Formellement, la question est de savoir s'il existe une fonction telle que satisfait (1) et (2) ci-dessus. De plus, la situation serait-elle différente si je prélevais plus d'un seul échantillon?
Réponses:
Je présenterai les conditions dans lesquelles un estimateur sans biais reste sans biais, même après avoir été borné. Mais je ne suis pas sûr qu'ils représentent quelque chose d'intéressant ou d'utile.
Soit un estimateurθ^ du paramètre inconnu θ d'une distribution continue, et E(θ^) = θ .
Supposons que, pour certaines raisons, sous échantillonnage répété, nous voulons que l’estimateur produise des estimations[δl,δu] . Nous supposons queθ ∈ [δl,δu] et nous pouvons donc écrire quand cela est commode l'intervalle comme [ θ - a , θ + b ] avec { a , b } nombres positifs mais bien sûr inconnus.
Alors l'estimateur contraint est
et sa valeur attendue est
Définissez maintenant les fonctions d'indicateur
et notez que
en utilisant ces fonctions d'indicateur et intégrales, nous pouvons écrire la valeur attendue de l'estimateur contraint comme (F(θ^) est la fonction de densité de θ^ ),
En décomposant les bornes supérieure et inférieure, nous avons
et en utilisant( 1 ) ,
Maintenant, depuisE(θ^) = θ on a
Mais
Par conséquent,E[(θ^−θ)Im]=0 et donc
Ou bien
Par conséquent, à partir de(4) , nous voyons que pour que l'estimateur contraint soit également sans biais, nous devons avoir
Quel est le problème avec la condition(5) ? Il implique les nombres inconnus{a,b} , donc en pratique nous ne pourrons pas réellement déterminer un intervalle pour délimiter l'estimateur et le garder sans biais.
Mais disons qu'il s'agit d'une expérience de simulation contrôlée, où nous voulons étudier d'autres propriétés des estimateurs, étant donné l'impartialité. Ensuite, nous pouvons "neutraliser"a et b en définissant a=b , ce qui crée essentiellement un intervalle symétrique autour de la valeur de θ ... Dans ce cas, pour atteindre l'impartialité, nous devons plus P(θ^≤δl)=P(θ^>δu) , c'est-à-dire que nous devons avoir que la masse de probabilité de l' estimateur non contraint est égale à la gauche et à la droite de la (symétrique autour deθ ) intervalle ...
... et nous apprenons donc que (comme conditions suffisantes), si la distribution de l'estimateur non contraint est symétrique autour de la valeur vraie, alors l'estimateur contraint dans un intervalle symétrique autour de la valeur vraie sera également non biaisé ... mais c'est presque trivialement évident ou intuitif, n'est-ce pas?
Cela devient un peu plus intéressant, si nous réalisons que la condition nécessaire et suffisante (étant donné un intervalle symétrique) a) ne nécessite pas une distribution symétrique , seulement une masse de probabilité égale "dans la queue" (et cela n'implique pas à son tour que le la distribution de la masse dans chaque queue doit être identique) et b) permet qu'à l'intérieur de l'intervalle, la densité de l'estimateur puisse avoir n'importe quelle forme non symétrique compatible avec le maintien de l'impartialité - cela rendra l'estimateur contraint sans biais.
APPLICATION: Le cas du POθ^=θ+w,w∼N(0,1) et donc θ^∼N(θ,1) . Ensuite, en utilisant(4) en écrivant a,b en terme de θ,δ , nous avons, pour l'intervalle de délimitation [0,1] ,
Notre estimateur est
La distribution est symétrique autourθ . Transformer (Φ() est le CDF normal standard)
On ne peut vérifier que les conditions supplémentaires ne s’annulent que siθ = une / deux , à savoir uniquement si l'intervalle de délimitation est également symétrique autour de θ .
la source