Estimation de la moyenne et du st dev d'une courbe gaussienne tronquée sans pic

11

Supposons que j'ai une boîte noire qui génère des données suivant une distribution normale avec la moyenne m et l'écart type s. Supposons, cependant, que chaque fois qu'il génère une valeur <0, il n'enregistre rien (ne peut même pas dire qu'il a généré une telle valeur). Nous avons une distribution gaussienne tronquée sans pic.

Comment estimer ces paramètres?


la source
J'ai changé la balise de "troncature-gaussienne" en "troncature" car la plupart des réponses seront potentiellement utiles dans des situations impliquant d'autres distributions.
whuber

Réponses:

7

Le modèle de vos données serait:

yiN(μ,σ2)I(yi>0)

Ainsi, la fonction de densité est:

f(yi|)=exp((yiμ)22σ2)2πσ (1ϕ(μσ))

où,

ϕ(.) est le cdf normal standard.

Vous pouvez ensuite estimer les paramètres et utilisant soit le maximum de vraisemblance soit les méthodes bayésiennes.μσ


la source
3

Comme l'a suggéré Srikant Vadali, Cohen et Hald ont résolu ce problème en utilisant ML (avec un localisateur de racines Newton-Raphson) vers 1950. Un autre article est "Estimation dans la distribution normale tronquée" de Max Halperin disponible sur JSTOR (pour ceux qui y ont accès). La recherche «d'estimation gaussienne tronquée» sur Google produit de nombreux résultats utiles.


Les détails sont fournis dans un fil qui généralise cette question (aux distributions tronquées en général). Voir Estimateurs du maximum de vraisemblance pour une distribution tronquée . Il pourrait également être intéressant de comparer les estimateurs de maximum de vraisemblance à la solution maximale donnée Entropy (avec le code) à Max Entropy Solver dans R .

whuber
la source
2

Avec une frontière technique TB pour une approche simplifiée de H. Schneider est très utile pour calculer la moyenne et l'écart type de la distribution normale tronquée:a=0μtσt

  1. calculer la moyenne et l'écart type (population entière!) pour l'ensemble de données:μσ

    μ=x¯=1ni=1nxi

    σ=s=1ni=1n(xix¯)2

  2. vérifier si la frontière technique a une distance valide à la moyenne :TB=a=0x¯

    la prise en compte de n'est pas nécessaire lorsqueTB=ax¯3s

  3. calculer et :ω,P3(ω),P4(ω)Q(ω)

    ω=s2(ax¯)2

    P3(ω)=1+5,74050101ω13,53427037ω2+6,88665552ω3

    P4(ω)=0,00374615+0,17462558ω2,87168509ω2+17,48932655ω311,91716546ω4

    Q(ω)=P4(ω)P3(ω)

  4. vérifier si , sinon la moyenne est ce qui n'est pas utile techniquementω0,57081μt<0

  5. calculer et pour la distribution normale tronquée:μtσt

    μt=x¯+Q(ω)(ax¯)

    σt2=s2+Q(ω)(ax¯)2

C'est tout...

JFS
la source