Il existe plusieurs statistiques sommaires. Lorsque vous voulez décrire la propagation d'une distribution, vous pouvez utiliser par exemple l' écart type ou le coefficient de Gini .
Je sais que l'écart type est basé sur la tendance centrale, c'est-à-dire l'écart par rapport à la moyenne, et le coefficient de Gini une mesure générale de la dispersion. Je sais également que le coefficient de Gini a une borne inférieure et une borne supérieure [0 1], et l'écart-type n'en a pas . Ces propriétés sont bonnes à savoir, mais quels enseignements peut donner l'écart type que le Gini ne peut pas et vice versa? Si je devais choisir d'utiliser l'un des deux, quels sont les avantages d'en utiliser un par rapport aux autres en termes d'information et de perspicacité.
la source
Réponses:
Deux choses à considérer
Le Gini est indépendant de l'échelle tandis que le SD est dans les unités d'origine
Supposons que nous ayons une mesure bornée au-dessus et au-dessous. SD prend sa valeur maximale si les demi-mesures sont à chaque borne alors que Gini prend le maximum si l'une est à une borne et tout le reste à l'autre.
la source
Le coefficient de Gini est invariant à l'échelle et est borné, l'écart-type invariant à un décalage, et sans limite, il est donc difficile de le comparer directement. Vous pouvez maintenant définir une version invariante d'échelle de l'écart-type, en divisant par la moyenne (coefficient de variation).
Cependant, l'indice de Gini est toujours basé sur des valeurs, le second sur des valeurs au carré, vous pouvez donc vous attendre à ce que le second soit davantage influencé par des valeurs aberrantes (valeurs excessivement basses ou élevées). Cela peut être trouvé dans Mesures des inégalités de revenu , F De Maio, 2007:
Donc, sauf si vous voulez caractériser une distribution presque gaussienne, si vous voulez mesurer une rareté, utilisez l'indice de Gini, si vous voulez promouvoir la rareté entre différents modèles, vous pouvez essayer un tel rapport de norme.
Conférence supplémentaire: Différence moyenne de Gini: une mesure supérieure de la variabilité pour les distributions non normales , Shlomo Yitzhaki, 2003, dont le résumé pourrait sembler intéressant:
la source
L'écart type a une échelle (disons, ° K, mètres, mmHg, ...). Habituellement, cela influence notre jugement sur son ampleur. Nous avons donc tendance à préférer le coefficient de variation ou encore mieux (sur des échantillons finis) l'erreur standard.
la source