Pourquoi Excel et WolframAlpha donnent des valeurs différentes pour l'asymétrie

14

pour les 3 valeurs suivantes 222,1122,45444

WolframAlpha donne 0,706

Excel, utilisation =SKEW(222,1122,45444) donne 1.729

Qu'est-ce qui explique la différence?

Scott Weinstein
la source
S'agit-il d'une asymétrie empirique ou peut-être non paramétrique ou d'une estimation de l' asymétrie?
gwr

Réponses:

17

Ils utilisent différentes méthodes pour calculer le biais. La recherche dans les pages d'aide skewness()du package R e1071donne:

Joanes and Gill (1998) discuss three methods for estimating skewness:

Type 1:
g_1 = m_3 / m_2^(3/2). This is the typical definition used in many older textbooks.
Type 2:
G_1 = g_1 * sqrt(n(n-1)) / (n-2). Used in SAS and SPSS.
Type 3:
b_1 = m_3 / s^3 = g_1 ((n-1)/n)^(3/2). Used in MINITAB and BMDP.
All three skewness measures are unbiased under normality.

#Why are these numbers different?
> skewness(c(222,1122,45444), type = 2)
[1] 1.729690
> skewness(c(222,1122,45444), type = 1)
[1] 0.7061429

Voici un lien vers le document référencé si quelqu'un a les informations d'identification pour l'obtenir pour une discussion ou une éducation supplémentaire: http://onlinelibrary.wiley.com/doi/10.1111/1467-9884.00122/abstract

Chasse
la source
4
Il n'est pas mathématiquement possible que «les trois mesures d'asymétrie soient impartiales», car (évidemment) leurs attentes diffèrent toutes. Peut-être voulez-vous dire asymptotiquement impartial?
whuber
@whuber - Je vais m'en remettre à [email protected] qui maintient le e1071paquet pour des éclaircissements sur ce qu'il voulait dire spécifiquement là-bas. Si mon message n'était pas clair, cela vient de la page d'aide deskewness()
Chase
3
g1
3
Le fait est que g1=m3/m23/2, où m2 et m3sont les deuxième et troisième moments de la moyenne, est l'asymétrie de la population. En tant qu'échantillon statistique, il soulève alors des problèmes similaires aux estimations non biaisées de l'écart-type, conduisant à des corrections basées surnqui ont une certaine justification mais ne produisent toujours pas d'estimations non biaisées. Mais je pense qu'il n'est pas très utile de dire que ce sont des estimations non biaisées de l'asymétrie pour les distributions symétriques; il en est de même de 0, qui présente une variance plus faible mais qui est incohérent et est inutile pour estimer l'asymétrie des distributions asymétriques.
Henry
@onestop @Henry Je suis d'accord avec vous.
whuber