La différence est des statistiques sommaires: coefficient de Gini et écart type

12

Il existe plusieurs statistiques sommaires. Lorsque vous voulez décrire la propagation d'une distribution, vous pouvez utiliser par exemple l' écart type ou le coefficient de Gini .

Je sais que l'écart type est basé sur la tendance centrale, c'est-à-dire l'écart par rapport à la moyenne, et le coefficient de Gini une mesure générale de la dispersion. Je sais également que le coefficient de Gini a une borne inférieure et une borne supérieure [0 1], et l'écart-type n'en a pas . Ces propriétés sont bonnes à savoir, mais quels enseignements peut donner l'écart type que le Gini ne peut pas et vice versa? Si je devais choisir d'utiliser l'un des deux, quels sont les avantages d'en utiliser un par rapport aux autres en termes d'information et de perspicacité.

Olivier_s_j
la source
1
Vous aviez un choix étrange de balises. Je les ai édités.
amibe

Réponses:

8

Deux choses à considérer

Le Gini est indépendant de l'échelle tandis que le SD est dans les unités d'origine

Supposons que nous ayons une mesure bornée au-dessus et au-dessous. SD prend sa valeur maximale si les demi-mesures sont à chaque borne alors que Gini prend le maximum si l'une est à une borne et tout le reste à l'autre.

mdewey
la source
Pensez-vous que nous pourrions étendre l'utilisation de Gini pour tenir compte de la concentration / hétérogénéité dans la méta-analyse? Cela pourrait être intéressant comme moyen de quantifier la concentration en hétérogénéité ...
Joe_74
1
Puisque l'hypothèse est que les effets sont normaux, alors non. Mais je pense qu'une discussion plus complète est hors sujet dans ce fil
mdewey
@mdewey Cette dernière phrase a été perspicace et m'a le plus aidé. THX!
Olivier_s_j
@mdewey J'ai testé cela moi-même avec du code, mais y a-t-il une publication quelque part qui en discute? Ou une preuve? (Je fais référence à la dernière phrase)
Olivier_s_j
@Ojtwist l'article Wikipedia en.wikipedia.org/wiki/Gini_coefficient est utile.
mdewey
10

Le coefficient de Gini est invariant à l'échelle et est borné, l'écart-type invariant à un décalage, et sans limite, il est donc difficile de le comparer directement. Vous pouvez maintenant définir une version invariante d'échelle de l'écart-type, en divisant par la moyenne (coefficient de variation).

Cependant, l'indice de Gini est toujours basé sur des valeurs, le second sur des valeurs au carré, vous pouvez donc vous attendre à ce que le second soit davantage influencé par des valeurs aberrantes (valeurs excessivement basses ou élevées). Cela peut être trouvé dans Mesures des inégalités de revenu , F De Maio, 2007:

Cette mesure de l'inégalité des revenus est calculée en divisant l'écart-type de la distribution des revenus par sa moyenne. Des distributions de revenu plus égales auront des écarts-types plus faibles; en tant que tel, le CV sera plus petit dans des sociétés plus égalitaires. Bien qu'elle soit l'une des mesures les plus simples de l'inégalité, l'utilisation du CV a été assez limitée dans la littérature sur la santé publique et n'a pas figuré dans les recherches sur l'hypothèse de l'inégalité des revenus. Cela peut être attribué à d'importantes limites de la mesure CV: (1) elle n'a pas de limite supérieure, contrairement au coefficient de Gini 18, ce qui rend l'interprétation et la comparaison un peu plus difficiles; et (2) les deux composantes du CV (la moyenne et l'écart type) peuvent être excessivement influencées par des valeurs de revenu anormalement faibles ou élevées. En d'autres termes,

1(xm)=|xnm|1/2N2(x)1(x)N2(x)

1/2

1/2

Donc, sauf si vous voulez caractériser une distribution presque gaussienne, si vous voulez mesurer une rareté, utilisez l'indice de Gini, si vous voulez promouvoir la rareté entre différents modèles, vous pouvez essayer un tel rapport de norme.

Conférence supplémentaire: Différence moyenne de Gini: une mesure supérieure de la variabilité pour les distributions non normales , Shlomo Yitzhaki, 2003, dont le résumé pourrait sembler intéressant:

De toutes les mesures de variabilité, la variance est de loin la plus populaire. Cet article soutient que la différence moyenne de Gini (GMD), un autre indice de variabilité, partage de nombreuses propriétés avec la variance, mais peut être plus informative sur les propriétés des distributions qui s'écartent de la normalité

Laurent Duval
la source
1

L'écart type a une échelle (disons, ° K, mètres, mmHg, ...). Habituellement, cela influence notre jugement sur son ampleur. Nous avons donc tendance à préférer le coefficient de variation ou encore mieux (sur des échantillons finis) l'erreur standard.

[0,1]

Horst Grünbusch
la source