Conditions pour que l'estimateur M converge vers la vraie moyenne

10

Étant donné des échantillons iid d'une distribution gaussienne et de l'estimateur M, , quelles propriétés sur sont suffisantes pour garantir la ? Est étant strictement convexe et strictement croissante suffisante?X1,...,XnN(μ,σ)μm=argminaρ(|Xia|)ρμmμρ

chenille
la source
Puisque vous pouvez prendre et alors est la moyenne de l'échantillon, cela signifie qu'il pourrait même ne pas être strictement convexe, mais augmenter strictement oui, donc ... Je mettrais strictement convexe ou strictement croissant, les deux semble suffisant, mais reste à prouver. Une convexité intuitivement stricte garantit un minimum global unique, car l'augmentation stricte est l'hypothèse de gaussianité qui compte. ρ(x)=xμm
Dmitrij Celov

Réponses:

1

L'article Asymptotique pour les minimiseurs de processus convexes de Hjort et Pollard peut aider ici, bien qu'il ne se spécialise pas dans les distributions gaussiennes et qu'il considère une forme plus générale de fonction de contraste, à savoir , bien que leur notation soit . En plus de la convexité de en , ils nécessitent une expansion de en autour de , dans un certain sens, lié à la distribution des données. Donc, pas aussi simple que de simplement dire que est convexe ou augmente, mais peut-être si vous limitez le théorème aux distributions gaussiennes etg ( y , t ) g t g t θ 0 ρ gρ(x,a)g(y,t)gtgtθ0ρgpour avoir le formulaire que vous spécifiez, vous pouvez obtenir un ensemble de conditions encore plus soigné. Je vais réécrire leur théorème ici pour être complet, légèrement paraphrasé:

Supposons que nous ayons

  • FY,Y1,Y2, iid de la distributionF
  • Paramètre d'intérêtθ0=θ(F)Rp
  • g ( y , t ) tθ0argmintRpEg(Y,t) , où est convexe en .g(y,t)t
  • On a une "faible expansion" de en autour de : pour un avec zéro moyen sous et pour une matrice définie positive .t θg(y,t)t g(y, θ 0 +t)-g(y, θ 0 )=D(y ) T t+R(y,t),D(y)F E R(Y,t)= 1θ0
    g(y,θ0+t)g(y,θ0)=D(y)Tt+R(y,t),
    D(y)FJ
    ER(Y,t)=12tTJt+o(|t|2), as t0
    J
  • Var[R(Y,t)]=o(|t|2) comme .t0
  • D(Y) a une matrice de covariance finie .K=D(y)D(y)TdF(y)

ALORS tout estimateur est -consistant pour , et asymptotiquement normal avec θ^nargminθRpi=1ng(Yi,t)nθ0

n(θ^nθ0)dNp(0,J1KJ1).
DavidR
la source
0

Ce ne sera pas une réponse, car cela réduira votre problème à un autre, mais je pense que cela pourrait être utile. Votre question porte essentiellement sur la cohérence de M-estimateur. Alors d'abord, nous pouvons regarder les résultats généraux. Voici le résultat du livre de van der Vaart (théorème 5.7, page 45):

Théorème Soit des fonctions aléatoires et Soit une fonction fixe de telle que pour chaque M θ ε > 0MnMθε>0

supθΘ|Mn(θ)M(θ)|P0,

supθ:d(θ,θ0)εM(θ)<M(θ0).

Ensuite, toute séquence d'estimateurs avec converge en probabilité versθ^nMn(θ^n)Mn(θ0)oP(1)θ0

Dans votre cas , etM ( θ ) = E ρ ( | X - θ | ) M n ( θ ) = 1θ0=μM(θ)=Eρ(|Xθ|)Mn(θ)=1nρ(|Xiθ|)

La condition clé ici est la convergence uniforme. À la page 46, van der Vaart dit

que pour les moyennes qui est votre cas cette condition équivaut à un ensemble de fonctions ( dans votre cas) étant Glivenko -Canteli . Un ensemble simple de conditions suffisantes est que soit compact, que les fonctions soient continues pour chaque , et> qu'elles soient dominées par une fonction intégrable.m θ = ρ ( | x - θ | ) Θ θ m θ ( x ) x{mθ,θΘ}mθ=ρ(|xθ|)Θθmθ(x)x

Dans Wooldridge, ce résultat est formulé sous la forme d'un théorème appelé loi uniforme faible des grands nombres, page 347 (première édition), théorème 12.1. Il ajoute seulement des exigences de mesurabilité à ce que déclare van der Vaart.

Dans votre cas, vous pouvez choisir en toute sécurité pour certains , vous devez donc montrer qu'il existe une fonction telle queC bΘ=[μC,μ+C]Cb

|ρ(|xθ|)|b(x)

pour tous les , tels que . La théorie des fonctions convexes pourrait être utile ici, car vous pouvezE b ( X ) < θΘEb(X)<

b(x)=supθΘ|ρ(|xθ|)|.

Si cette fonction a de belles propriétés, vous êtes prêt à partir.

mpiktas
la source