Je sais que si la médiane et la moyenne sont approximativement égales, cela signifie qu'il y a une distribution symétrique, mais dans ce cas particulier, je ne suis pas certain. La moyenne et la médiane sont assez proches (seulement une différence de 0,487 m / gallon), ce qui m'amènerait à dire qu'il y a une distribution symétrique mais en regardant le boxplot, il semble qu'il soit légèrement biaisé positivement (la médiane est plus proche du T1 que du Q3 comme confirmé) par les valeurs).
(J'utilise Minitab si vous avez des conseils spécifiques pour ce logiciel.)
Réponses:
Sans doute, on vous a dit le contraire, mais la moyenne médiane n'implique pas la symétrie.=
Il existe une mesure d'asymétrie basée sur la moyenne moins la médiane (la deuxième asymétrie de Pearson), mais elle peut être 0 lorsque la distribution n'est pas symétrique (comme n'importe quelle mesure d'asymétrie commune).
De même, la relation entre la moyenne et la médiane n'implique pas nécessairement une relation similaire entre le midhinge ( ) et la médiane. Ils peuvent suggérer une asymétrie opposée, ou l'un peut être égal à la médiane tandis que l'autre ne le fait pas.( Q1+ Q3) / 2
Une façon d'étudier la symétrie consiste à utiliser un tracé de symétrie *.
Si sont les observations ordonnées du plus petit au plus grand (les statistiques de l'ordre), et est la médiane, alors un diagramme de symétrie trace vs , vs , ... et ainsi de suite. M Y ( n ) - M M - Y ( 1 ) Y ( n - 1 ) - M M - Y ( 2 )Oui( 1 ), Y( 2 ), . . . , Y( n ) M Oui( n )- M M- Oui( 1 ) Oui( n - 1 )- M M- Oui( 2 )
* Minitab peut le faire . En effet, je soulève ce complot comme une possibilité parce que je les ai vu faire dans Minitab.
Voici quatre exemples:
(Les distributions réelles étaient (de gauche à droite, rangée du haut en premier) - Laplace, Gamma (forme = 0,8), beta (2,2) et beta (5,2). Le code est celui de Ross Ihaka, d' ici )
Avec des exemples symétriques à queue lourde, il arrive souvent que les points les plus extrêmes puissent être très loin de la ligne; vous feriez moins attention à la distance de la ligne d'un ou deux points lorsque vous vous approchez du coin supérieur droit de la figure.
Il y a bien sûr d'autres tracés (j'ai mentionné le tracé de symétrie non pas à partir d'un sens particulier du plaidoyer de celui-ci, mais parce que je savais qu'il était déjà implémenté dans Minitab). Explorons donc quelques autres.
Voici les skewplots correspondants que Nick Cox a suggérés dans les commentaires:
Dans ces graphiques, une tendance à la hausse indiquerait une queue droite généralement plus lourde que la gauche et une tendance à la baisse indiquerait une queue gauche généralement plus lourde que la droite, tandis que la symétrie serait suggérée par un graphique relativement plat (quoique peut-être assez bruyant).
Nick suggère que cette intrigue est meilleure (spécifiquement "plus directe"). Je suis enclin à accepter; l'interprétation du graphique semble par conséquent un peu plus facile, bien que les informations dans les graphiques correspondants soient souvent assez similaires (après avoir soustrait la pente unitaire dans le premier ensemble, vous obtenez quelque chose de très similaire au deuxième ensemble).
[Bien sûr, aucune de ces choses ne nous dira que la distribution à partir de laquelle les données ont été tirées est en fait symétrique; nous obtenons une indication de la proximité de symétrie de l'échantillon et, dans cette mesure, nous pouvons juger si les données sont raisonnablement cohérentes avec le fait d'être tirées d'une population quasi symétrique.]
la source
skewplot
(SSC). L'idée remonte au moins à une suggestion attribuée à JW Tukey dans Wilk, MB et Gnanadesikan, R. 1968. Méthodes de traçage des probabilités pour l'analyse des données. Biometrika 55: 1-17.Le plus simple est de calculer l' asymétrie de l'échantillon . Il y a une fonction dans Minitab pour cela. Les distributions symétriques auront une asymétrie nulle. L'asymétrie zéro ne signifie pas nécessairement symétrique, mais dans la plupart des cas pratiques, ce serait le cas.
Comme l'a noté @NickCox, il existe plusieurs définitions de l'asymétrie. J'utilise celui qui est compatible avec Excel , mais vous pouvez en utiliser n'importe quel autre.
la source
Centrez vos données autour de zéro en soustrayant la moyenne de l'échantillon. Maintenant, divisez vos données en deux parties, la négative et la positive. Prenez la valeur absolue des points de données négatifs. Faites maintenant un test de Kolmogorov-Smirnov à deux échantillons en comparant les deux partitions l'une à l'autre. Faites votre conclusion sur la base de la valeur de p.
la source
Mettez vos observations triées en valeurs croissantes dans une colonne, puis mettez-les triées en valeurs décroissantes dans une autre colonne.
Calculez ensuite le coefficient de corrélation (appelez-le Rm) entre ces deux colonnes.
Calculez l'indice chiral: CHI = (1 + Rm) / 2.
CHI prend des valeurs dans l'intervalle [0..1].
CHI est nul SI et UNIQUEMENT SI votre échantillon est distribué symétriquement.
Pas besoin du troisième moment.
Théorie:
http://petitjeanmichel.free.fr/itoweb.petitjean.skewness.html
http://petitjeanmichel.free.fr/itoweb.petitjean.html
(la plupart des articles cités dans ces deux pages sont téléchargeables en pdf)
J'espère aide, même récemment.
la source