Sur la base de certains des commentaires de @ mary, je pense que ce qui suit est approprié. Elle semble sélectionner la médiane car l'échantillon est petit.
Si vous sélectionnez la médiane parce que c'est un petit échantillon, ce n'est pas une bonne justification. Vous sélectionnez la médiane car la médiane est une valeur importante. Cela dit quelque chose de différent de la moyenne. Vous pouvez également le sélectionner pour certains calculs statistiques, car il est robuste contre certains problèmes tels que les valeurs aberrantes ou l'inclinaison. Cependant, la petite taille de l'échantillon n'est pas l'un de ces problèmes contre lesquels il est robuste. Par exemple, lorsque la taille de l'échantillon diminue, elle est en réalité beaucoup plus sensible à l'inclinaison que la moyenne.
Sokal et Rohlf donnent cette formule dans leur livre Biometry (page 139). Sous «Commentaires sur l'applicabilité», ils écrivent: Grands échantillons provenant de populations normales. J'ai donc peur que la réponse à votre question soit non. Voir aussi ici .
Une méthode pour obtenir l'erreur standard et les intervalles de confiance pour la médiane dans de petits échantillons avec des distributions non normales serait l' amorçage. Cet article fournit des liens vers des packages Python pour le démarrage.
avertissement
@whuber a souligné que le bootstrap de la médiane dans de petits échantillons n'est pas très informatif car les justifications du bootstrap sont asymptotiques (voir les commentaires ci-dessous).
la source
Le nombre magique 1,253 provient de la formule de variance asymptotique :
Pour toute distribution autre que la normale (et Mary admet que cela est douteux dans ses données), vous auriez un facteur différent. Obtenir l'estimation médianem^ n'est pas si grave, bien que vous puissiez commencer à vous tourmenter à propos des valeurs moyennes pour le nombre pair d'observations par rapport à l'inversion du cdf ou quelque chose comme ça. La valeur de densité pertinente peut être estimée par des estimateurs de densité de noyau , si nécessaire. Dans l'ensemble, cela est bien sûr relativement douteux car trois approximations sont faites:
Plus la taille de l'échantillon est faible, plus elle devient douteuse.
la source