Supposons que j'ai une boîte noire qui génère des données suivant une distribution normale avec la moyenne m et l'écart type s. Supposons, cependant, que chaque fois qu'il génère une valeur <0, il n'enregistre rien (ne peut même pas dire qu'il a généré une telle valeur). Nous avons une distribution gaussienne tronquée sans pic.
Comment estimer ces paramètres?
Réponses:
Le modèle de vos données serait:
Ainsi, la fonction de densité est:
où,
Vous pouvez ensuite estimer les paramètres et utilisant soit le maximum de vraisemblance soit les méthodes bayésiennes.μ σ
la source
Comme l'a suggéré Srikant Vadali, Cohen et Hald ont résolu ce problème en utilisant ML (avec un localisateur de racines Newton-Raphson) vers 1950. Un autre article est "Estimation dans la distribution normale tronquée" de Max Halperin disponible sur JSTOR (pour ceux qui y ont accès). La recherche «d'estimation gaussienne tronquée» sur Google produit de nombreux résultats utiles.
Les détails sont fournis dans un fil qui généralise cette question (aux distributions tronquées en général). Voir Estimateurs du maximum de vraisemblance pour une distribution tronquée . Il pourrait également être intéressant de comparer les estimateurs de maximum de vraisemblance à la solution maximale donnée Entropy (avec le code) à Max Entropy Solver dans R .
la source
Avec une frontière technique TB pour une approche simplifiée de H. Schneider est très utile pour calculer la moyenne et l'écart type de la distribution normale tronquée:a=0 μt σt
calculer la moyenne et l'écart type (population entière!) pour l'ensemble de données:μ σ
vérifier si la frontière technique a une distance valide à la moyenne :TB=a=0 x¯
la prise en compte de n'est pas nécessaire lorsqueTB=a x¯≤3s
calculer et :ω,P3(ω),P4(ω) Q(ω)
vérifier si , sinon la moyenne est ce qui n'est pas utile techniquementω≤0,57081 μt <0
calculer et pour la distribution normale tronquée:μt σt
C'est tout...
la source