Je veux calculer le paramètre de la distribution exponentielle à partir d'un échantillon de population extrait de cette distribution dans des conditions biaisées. Pour autant que je sache, pour un échantillon de n valeurs, l'estimateur habituel est. Cependant, mon échantillon est biaisé comme suit:
A partir d'une population complète de m éléments tirés iid de la distribution exponentielle, seuls les n plus petits éléments sont connus. Comment estimer le paramètre dans ce scénario?
Un peu plus formellement, si les échantillons sont-ils tirés de , de telle sorte que pour chaque on a , alors comment puis-je estimer de l'ensemble où .
Merci beaucoup!
Michael
Réponses:
L'estimateur du maximum de vraisemblance pour le paramètre de la distribution exponentielle sous la censure de type II peut être dérivé comme suit. Je suppose que la taille de l'échantillon estm , dont le n<m les plus petits sont observés et m−n les plus grands sont non observés (mais connus pour exister).
Supposons (pour des raisons de simplicité de notation) que lesxi sont commandés: 0≤x1≤x2≤⋯≤xn . Ensuite, la densité de probabilité conjointe dex1,…,xn est:
où la première exponentielle se rapporte aux probabilités de lan observé xi et le second aux probabilités du m−n inobservé xi qui sont supérieurs à xn (qui est juste 1 - le CDF à xn .) Réorganiser les termes conduit à:
(Notez que la sommen−1 car il y a un "+1 "dans le coefficient de xn .) Prendre le log, puis le dérivé wrt λ et ainsi de suite conduit à l'estimateur du maximum de vraisemblance:
la source
Cela relie la réponse de @ jbowman à mon commentaire. À savoir, selon des hypothèses de travail courantes, on peut utiliser la «probabilité de survie standard» sous la censure de type II.
PS1: Notez que cela n'est pas limité à la distribution exponentielle.
PS2: Les détails peuvent être trouvés dans la section 2.2 du livre de Lawless .
la source
En supposantn est connue, une estimation peut être obtenue via
La logique est: si vous aviez l'ensemble complet den échantillons, vous pouvez construire le CDF empirique, Φ , à partir de cet échantillon. Ensuite, si vous avez pris un articlek de ce tableau trié, il correspondrait à la valeur CDF k/n . Dans de nombreux cas,k=n/2 est un choix utile.
la source