Jeux olympiques - La Hongrie a une avance à deux chiffres dans l'or? (Population relative)

9

J'ai créé une page Web qui présente les résultats des médailles olympiques en direct de Thompson Reuters et les chiffres de population mondiale de la CIA.

Les résultats m'intéressent - la Hongrie possède une avance à deux chiffres dans les médailles d'or dans le reste du monde. En outre, les États-Unis et la Chine se situent près du bas dans presque toutes les catégories.

Ma question est - est-ce que je présente les données de manière équitable? J'ai simplement pris la plus grande population, puis créé un facteur pour chaque pays en fonction de cela. Les colonnes relatives au nombre de médailles sont basées sur ce facteur.

Quelle (s) colonne (s) puis-je ajouter? Quels autres facteurs pourrais-je ajouter pour présenter le point de vue le plus juste? La vue absolue est simple - Reuters le fait. Comment créer une vue fidèle?

https://rack.pub/rio

entrez la description de l'image ici

Ronnie Royston
la source
3
Pour le moment, cette question n'est pas très claire. Que signifie «plomb à deux chiffres en or»? Lorsque vous dites "créé un facteur pour chaque pays sur la base de cela", comment le facteur a-t-il été créé? Cet exercice consiste-t-il essentiellement à déterminer des «médailles par habitant», éventuellement remaniées d'une manière ou d'une autre?
Silverfish
2
C'est la réaction que je reçois de tous ceux avec qui je partage mon avis. Peut-être que je ne l'explique pas bien. Les populations sont la Chine 1 367 485 388, les États-Unis 321 368 864, la Hongrie 9 897 541, le facteur serait donc de 1 pour la Chine, 4,26 pour les États-Unis et 138,16 pour la Hongrie. L'avance à deux chiffres signifie ce qu'elle dit - le nombre relatif de médailles d'or est le double du pays le plus proche.
Ronnie Royston
3
Je ne pense pas que l'évaluation du nombre de médailles par rapport à la population d'un pays ait beaucoup de sens. Pensez-vous que la Chine et l'Inde «devraient» gagner> 1/3 de toutes les médailles? En tout cas, cela semble être une question pour les experts en la matière; cela ne semble pas être une question statistique.
gung - Rétablir Monica
6
@RonRoyston Une raison de soupçonner que ce n'est pas juste est que les concours olympiques limitent le nombre d'athlètes de chaque pays. Les détails diffèrent entre les sports, mais il serait mathématiquement impossible pour un pays avec 90% de la population mondiale d'obtenir 90% des médailles pour cette raison - sur de nombreux podiums, ils seraient limités à une ou au plus deux médailles. Une proportionnalité stricte ne peut donc pas tenir.
Silverfish
3
Envisagez un concours de médailles où une seule équipe ou personne par pays peut être inscrite. En supposant que le talent et la formation soient uniformément répartis, on pourrait s'attendre à ce que les athlètes chinois forment un sixième des places dans le top 100 mondial dans ce sport, mais une proportion beaucoup plus faible de concurrents olympiques!
Silverfish

Réponses:

0

Vous essayez de trouver une estimation des chances de gagner une médaille, sachant que les "données" dont nous disposons ne sont que le nombre par pays. C'est une grande question, une solution juste étant plus proche de l'esprit des Jeux Olympiques.

Fondamentalement, il s'agit d'un problème statistique qui est bien approché par votre méthode comme le nombre moyen (fréquence) de médailles (pour chaque couleur) par rapport à la population. Mais quelle est la fiabilité de cette méthode? Cela est assez proche du problème d'estimation de la fiabilité d'un tirage binomial à partir d'un nombre différent de lancers qui a des applications, par exemple, pour comparer la qualité des revendeurs sur Amazon en fonction de différents nombres de commentaires (voir cette explication approfondie ).

Dans ce cas particulier, le nombre d'habitants est toujours suffisant pour faire l'approximation de la distribution bêta avec une normale - de sorte qu'il est certainement possible de comparer la significativité de chaque estimation pour chaque pays.

meduz
la source
2
Les décomptes de médailles ne sont pas indépendants (comme le suppose votre modèle). L'effet le plus profond est dû à l'accumulation de plusieurs médailles par les individus.
whuber
Bon, cela signifierait qu'il serait nécessaire d'utiliser des statistiques de classement, je suppose.
meduz