Si vous définissez comme la version triée de vos données d'origine , la médiane est définie comme suit:O1,O2,…,ONX1,X2,…,XN
Median({O1,O2,…,ON})={O(N+1)/2(ON/2+ON/2+1)/2if N is oddotherwise
Sans ordonner vos données, vous pouvez utiliser la définition de la médiane géométrique pour définir la médiane dans une dimension:
Median({X1,X2,…,XN})=argminy∑i=1N∣∣Xi−y∣∣
Notez que cela ne définit pas nécessairement une médiane unique lorsqu'il y a un nombre pair de points; par exemple, n'importe quel nombre optimise l'objectif avec .y∈[3,4]X={2,3,4,5}
Une autre façon d'exprimer la moyenne est l'estimation des «moindres carrés»:
Choisir pour être la moyenne donne la plus petite valeur de la somme des erreurs quadratiques.m
Maintenant, la médiane peut être exprimée comme l'estimation des «écarts les moins absolus»:
Choisir pour être la médiane donne la plus petite valeur de la somme des erreurs absolues.m
la source
La médiane est la valeur correspondant au demi-quantile, c'est-à-dire que la moitié des valeurs sont plus élevées, la moitié sont plus faibles (pardonnez-moi pour ignorer les cas avec égalité ou lorsque l'ensemble est pair ...). Telle que, étant donné que le pdf de l'ensemble de données est connu, alors la distribution cumulative est facilement évaluée. Notant cette fonction, puispX X1⋅Xn PX
Prenons par exemple le cas des angles dans cette méthode utilisée dans cet article de revue pour l'égalisation de l'histogramme. Le panneau inférieur gauche montre le pdf des angles dans un ensemble d'images naturelles. est la distribution cumulative et la médiane est la valeur de correspondant à la valeur , soit environ dans ce cas.p(θ) P(θ) θ 1/2 0
la source