Inspiré par des " exemples concrets de distributions communes ", je me demande quels exemples pédagogiques les gens utilisent pour démontrer une asymétrie négative? Il existe de nombreux exemples "canoniques" de distributions symétriques ou normales utilisées dans l'enseignement - même si celles comme la taille et le poids ne survivent pas à un examen biologique plus approfondi! La pression artérielle pourrait être une normalité plus proche. J'aime les erreurs de mesure astronomiques - d'un intérêt historique, elles ne sont intuitivement pas plus susceptibles de se situer dans une direction que dans l'autre, avec de petites erreurs plus susceptibles que grandes.
Les exemples pédagogiques courants d'asymétrie positive comprennent les revenus des personnes; kilométrage sur les voitures d'occasion à vendre; temps de réaction dans une expérience de psychologie; prix des maisons; nombre de réclamations pour accident par un client d'assurance; nombre d'enfants dans une famille. Leur caractère raisonnablement raisonnable provient souvent du fait d'être limité en dessous (généralement de zéro), des valeurs faibles étant plausibles, même courantes, mais des valeurs très grandes (parfois des ordres de grandeur plus élevés) sont bien connues.
Pour un biais négatif, je trouve plus difficile de donner des exemples sans ambiguïté et vivants qu'un jeune public (lycéens) peut saisir intuitivement, peut-être parce que moins de distributions réelles ont une limite supérieure claire. Un exemple de mauvais goût qu'on m'a enseigné à l'école était le "nombre de doigts". La plupart des gens en ont dix, mais certains en perdent un ou plusieurs dans des accidents. Le résultat était "99% des gens ont un nombre de doigts supérieur à la moyenne"! La polydactylie complique le problème, car dix n'est pas une limite supérieure stricte; étant donné que les doigts manquants et les doigts supplémentaires sont des événements rares, il peut ne pas être clair pour les élèves quel effet prédomine.
J'utilise généralement une distribution binomiale avec un élevé . Mais les élèves trouvent souvent que "le nombre de composants satisfaisants dans un lot est biaisé négativement" moins intuitif que le fait complémentaire que "le nombre de composants défectueux dans un lot est faussé positivement". (Le manuel a un thème industriel; je préfère les œufs fêlés et intacts dans une boîte de douze.) Les élèves estiment peut-être que le «succès» devrait être rare.
Une autre option consiste à souligner que si est biaisé positivement, alors - X est biaisé négativement, mais le placer dans un contexte pratique ("les prix des logements négatifs sont biaisés négativement") semble voué à l'échec pédagogique. Bien qu'il y ait des avantages à enseigner les effets des transformations de données, il semble sage de donner d'abord un exemple concret. Je préférerais une solution qui ne semble pas artificielle, où le biais négatif est tout à fait sans ambiguïté, et pour lequel l'expérience de vie des étudiants devrait leur donner une conscience de la forme de la distribution.
la source
Réponses:
Au Royaume-Uni, prix d'un livre. Il existe un «prix de vente recommandé» qui sera généralement le prix modal, et pratiquement nulle part vous n'auriez à payer plus. Mais certains magasins feront des rabais, et quelques-uns feront de gros rabais.
Aussi, l'âge à la retraite. La plupart des gens prennent leur retraite à 65-68 ans, date à laquelle la pension de l'État entre en vigueur, très peu de gens travaillent plus longtemps, mais certaines personnes prennent leur retraite dans la cinquantaine et beaucoup au début de la soixantaine.
Ensuite aussi, le nombre de GCSE que les gens obtiennent. La plupart des enfants sont inscrits pour 8-10 et obtiennent donc 8-10. Un petit nombre en fait plus. Certains enfants ne réussissent pas tous leurs examens, il y a donc une augmentation constante de 0 à 7.
la source
Nick Cox a commenté avec précision que "l'âge à la mort est biaisé négativement dans les pays développés", ce que je pensais être un excellent exemple.
J'ai trouvé que les chiffres les plus pratiques sur lesquels je pouvais mettre la main provenaient du Australian Bureau of Statistics ( en particulier, j'ai utilisé cette feuille Excel ), car leurs bacs d'âge remontaient à 100 ans et le plus vieil homme australien avait 111 ans , donc j'ai senti à l'aise de couper le bac final à 110 ans. D'autres agences statistiques nationales semblaient souvent s'arrêter à 95, ce qui rendait le bac final inconfortablement large. L'histogramme résultant montre une asymétrie négative très claire, ainsi que d'autres caractéristiques intéressantes telles qu'un petit pic de mortalité parmi les jeunes enfants, ce qui serait bien adapté à la discussion et à l'interprétation en classe.
Le code R avec des données brutes suit, le
HistogramTools
paquet s'est avéré très utile pour le traçage basé sur des données agrégées! Merci à cette question StackOverflow pour l'avoir signalé .la source
Voici les résultats pour les quarante athlètes qui ont réussi un saut légal dans la ronde de qualification du saut en longueur olympique masculin 2012, présenté dans un diagramme de densité de noyau avec un tracé de tapis en dessous.
Il semble beaucoup plus facile d'être à un mètre derrière le groupe principal de concurrents que d'avoir un mètre d'avance, ce qui expliquerait l'asymétrie négative.
Je soupçonne qu'une partie du regroupement à l'extrémité supérieure est due aux athlètes qui visent la qualification (qui nécessitait un classement parmi les douze premiers ou un résultat de 8,10 mètres ou plus) plutôt que d'atteindre la distance la plus longue possible. Le fait que les deux premiers résultats aient été de 8,11 mètres, juste au-dessus de la marque de qualification automatique, est fortement suggestif, tout comme la façon dont les sauts médaillés de la finale étaient à la fois plus longs et plus répartis à 8,31, 8,16 et 8,12 mètres. Les résultats de la finale présentaient un léger biais négatif non significatif.
A titre de comparaison, les résultats du Heptathlon olympique à Séoul en 1988 sont disponibles dans l'
heptathlon
ensemble de données dans le package RHSAUR
. Dans cette compétition, il n'y a pas eu de tour de qualification mais chaque épreuve a apporté des points au classement final; les compétitrices ont montré une asymétrie négative prononcée dans les résultats du saut en hauteur et une asymétrie quelque peu négative dans le saut en longueur. Il est intéressant de noter que cela n'a pas été reproduit dans les épreuves de lancer (tir et javelot) même s'il s'agit également d'événements dans lesquels un nombre plus élevé correspond à un meilleur résultat. Les notes finales ont également été quelque peu biaisées.Données et code
la source
Les scores aux tests faciles, ou alternativement, les scores aux tests pour lesquels les étudiants sont particulièrement motivés, ont tendance à être biaisés.
En conséquence, les scores SAT / ACT des étudiants entrant dans les collèges recherchés (et plus encore, leurs GPA) ont tendance à être asymétriques. Il y a beaucoup d'exemples sur collegeapps.about.com, par exemple, une intrigue de l'Université de Chicago SAT / ACT et GPA est ici .
De même, les GPA des diplômés sont souvent asymétriques, par exemple les histogrammes ci-dessous des GPA des diplômés blancs et noirs dans une université à but lucratif tirés de la figure 5 de Gramling, Tim. « Comment cinq caractéristiques des étudiants prédisent avec précision les probabilités d'obtention d'un diplôme universitaire à but lucratif .» SAGE Open 3.3 (2013): 2158244013497026.
(Il n'est pas difficile de trouver d'autres exemples similaires.)
la source
Dans l'analyse des frontières stochastiques, et en particulier dans son objectif historique initial, la production, la fonction de production d'une entreprise / unité de production en général, est spécifiée stochastiquement comme
Donc, l'asymétrie négative est, je dirais, la modélisation la plus naturelle des efforts de la race humaine elle-même: s'écartant toujours de son idéal imaginé - dans la plupart des cas en retard (la partie négative de la densité), alors que dans relativement moins de cas, transcendant ses limites perçues (la partie positive de la densité). Les étudiants eux-mêmes peuvent être modélisés comme une telle fonction de production. Il est simple de cartographier la perturbation symétrique et l'erreur unilatérale à des aspects de la vie réelle. Je ne peux pas imaginer comment plus intuitif peut-on y arriver.
la source
L'asymétrie négative est courante en hydrologie des crues. Ci-dessous, un exemple de courbe de fréquence des crues (South Creek at Mulgoa Rd, lat -33.8783, lon 150.7683) que j'ai emprunté à 'Australian Rainfall and Runoff' (ARR) le guide d'estimation des crues développé par Engineers, Australie.
Il y a un commentaire dans ARR:
Souvent, les inondations, à un endroit particulier, sont considérées comme ayant une limite supérieure appelée «inondation maximale probable» (PMF). Il existe des moyens standard de calculer un PMF.
la source
Les changements (rendements) des prix des actifs ont généralement une asymétrie négative - de nombreuses petites augmentations de prix avec quelques baisses de prix importantes. Le biais semble se maintenir pour presque tous les types d'actifs: cours des actions, prix des matières premières, etc. Le décalage négatif peut être observé dans les variations de prix mensuelles, mais il est beaucoup plus évident lorsque vous commencez à regarder les variations de prix quotidiennes ou horaires. Je pense que ce serait un bon exemple car vous pouvez montrer les effets de la fréquence sur l'inclinaison.
Plus de détails: http://www.fusioninvesting.com/2010/09/what-is-skew-and-why-is-it-important/
la source
L'âge gestationnel à l'accouchement (en particulier pour les naissances vivantes) reste asymétrique. Les nourrissons peuvent naître vivants très tôt (bien que les chances de survie soient faibles lorsqu'ils sont trop tôt), culminent entre 36 et 41 semaines et chutent rapidement. Aux États-Unis, il est typique d'être induite si 41/42 semaines, donc nous ne voyons généralement pas beaucoup d'accouchements après ce point.
la source
Dans les pêcheries, il existe souvent des exemples de biais négatifs dus aux exigences réglementaires. Par exemple, la distribution de la longueur du poisson relâché dans la pêche récréative; parce qu'il y a parfois une longueur minimale qu'un poisson doit être pour qu'il puisse être conservé, tous les poissons sous la limite sont rejetés. Mais parce que les gens pêchent là où il y a généralement du poisson de longueur légale, il y a généralement un biais négatif et un mode vers la limite légale supérieure. La longueur légale ne représente cependant pas une coupure ferme. En raison des limites de sacs (ou des limites du nombre de poissons qui peuvent être ramenés au quai), les gens rejetteront toujours les poissons de taille légale lorsqu'ils en auront capturé de plus gros.
par exemple, Sauls, B. 2012. Un résumé des données sur la distribution des tailles et les conditions de rejet des rejets de vivaneaux rouges provenant des relevés de la pêche récréative dans le golfe du Mexique. SEDAR31-DW11. SEDAR, North Charleston, Caroline du Sud. 29 pp.
la source
De grandes suggestions ont été faites sur ce fil. Sur le thème de la mortalité liée à l'âge, les taux de défaillance des machines sont souvent fonction de l'âge des machines et entrent dans cette classe de distributions. En plus des facteurs financiers déjà mentionnés, les fonctions et les répartitions des pertes financières ressemblent généralement à ces formes, en particulier dans le cas de pertes de valeur extrême, par exemple, comme le montrent les estimations BRI III (Bank of International Settlement) du déficit attendu (ES), ou dans BIS II, la valeur à risque (VAR) en tant qu'intrants des exigences réglementaires pour l'allocation des réserves de capital.
la source
Aux États-Unis, l'âge de la retraite est faussé. La majorité des retraités sont plus âgés et quelques-uns partent relativement jeunes.
la source
Dans la théorie des matrices aléatoires, la distribution de Tracy Widom est asymétrique à droite. Il s'agit de la distribution de la plus grande valeur propre d'une matrice aléatoire. Par symétrie, la plus petite valeur propre a une distribution Tracy Widom négative et est donc asymétrique à gauche.
Cela est à peu près dû au fait que les valeurs propres aléatoires s'apparentent à des particules chargées qui se repoussent, et donc la plus grande valeur propre a tendance à être éloignée du reste. Voici une photo exagérée (prise d' ici ):
la source