J'ai un ensemble de valeurs dont je calcule la médiane M. Je me demandais comment je pouvais calculer l'erreur sur cette estimation.
Sur le net, j'ai trouvé qu'il peut être calculé comme où est l'écart type. Mais je n'ai pas trouvé de références à ce sujet. Donc je ne comprends pas pourquoi .. Quelqu'un pourrait-il me l'expliquer?
Je pensais que je pourrais utiliser le bootstrap pour avoir une estimation de l'erreur mais je voudrais l'éviter car cela ralentirait beaucoup mon analyse.
Je pensais aussi à calculer l'erreur sur la médiane de cette manière
Est-ce que ça fait du sens?
standard-deviation
bootstrap
standard-error
median
shamalaia
la source
la source
Réponses:
Pour traiter directement les erreurs sur la médiane, vous pouvez utiliser l'intervalle de confiance non paramétrique exact pour la médiane, qui utilise des statistiques d'ordre. Si vous voulez quelque chose de différent, c'est-à-dire une mesure de dispersion, considérez la différence moyenne de Gini. Le code est ici pour l'intervalle de confiance de la médiane.
la source
Comme indiqué dans l'autre réponse, il existe un IC non paramétrique pour la médiane utilisant les statistiques d'ordre. Ce CI est meilleur à bien des égards que ce que vous avez trouvé sur le net.
Maintenant, si vous devez savoir d'où vient le , la réponse vient de la distribution asymptotique de la médiane. Si nous notons la médiane de l'échantillon par et la médiane de la population par alors on peut montrer que1.2533σN√ θ~ θ
où est la distribution de votre échantillon. Le résultat n'est pas aussi universel que le CLT car la distribution asymptptique dépend toujours de la distribution sous-jacente de votre échantillon (via le terme ). Vous pouvez, cependant, simplifier radicalement le fait que votre échantillon provient d'une distribution normale avec la moyenne -et la médiane- et la variance . L'évaluation de à son point de symétrie donne alorsf [f(θ)]2 θ σ2 f
et donc la variance asymptotique devient
Divisez par et prenez la racine carrée de cela pour arriver à votre erreur standard .N 1.2533σN√
la source