- Première déclaration (S1): "Un décès sur 80 est causé par un accident de voiture."
- Deuxième déclaration (S2): "Une personne sur 80 meurt des suites d'un accident de voiture."
Personnellement, je ne vois pas beaucoup de différence entre ces deux déclarations. En écrivant, je les considèrerais comme interchangeables pour un public laïc. Cependant, deux personnes m'ont lancé un défi à ce sujet et je recherche une perspective supplémentaire.
Mon interprétation par défaut de S2 est la suivante: "Sur 80 personnes tirées uniformément de la population humaine, nous nous attendrions à ce qu’une d’elles meure des suites d’un accident de voiture" - et j’estime que cette affirmation qualifiée est équivalente à S1.
Mes questions sont les suivantes:
Q1) Est-ce que mon interprétation par défaut est équivalente à Statement One?
Q2) Est-ce inhabituel ou téméraire que ce soit mon interprétation par défaut?
Q3) Si vous pensez que S1 et S2 sont différents, de manière à indiquer le second quand on veut dire que le premier est trompeur / incorrect, pourriez-vous fournir une révision complète et qualifiée de S2 équivalente?
Laissons de côté le casse-tête évident selon lequel S1 ne fait pas spécifiquement référence à des morts humaines et supposons que cela soit compris dans son contexte. Laissons également de côté toute discussion sur la véracité de la revendication elle-même: elle se veut illustrative.
Autant que je sache, les désaccords que j'ai entendus jusqu'à présent semblent se centrer sur le fait de ne pas adopter différentes interprétations des première et deuxième déclarations.
Pour le premier, mes challengers semblent l’interpréter comme 1/80 * num_deaths = nombre de décès causés par des accidents de voiture, mais pour une raison quelconque, une interprétation différente du second du type "si vous avez un ensemble de 80 personnes, l' un d'entre eux va mourir dans un accident de voiture »( ce qui est évidemment pas une réclamation équivalente). Je pense que compte tenu de leur interprétation de S1, leur valeur par défaut pour S2 serait de le lire comme suit: (1/80 * num_dead_people = nombre de personnes décédées dans un accident de voiture == nombre de décès causés par un accident de voiture). Je ne sais pas pourquoi la divergence d'interprétation (leur hypothèse par défaut pour S2 est une hypothèse beaucoup plus forte), ou s'ils ont un sens statistique inné qui me manque en fait.
la source
Réponses:
Tout d'abord, ma première pensée intuitive était: "S2 ne peut être identique à S1 que si le taux de mortalité par le trafic reste constant, éventuellement sur des décennies" - ce qui n'aurait certainement pas été une bonne hypothèse au cours des dernières décennies. Cela laisse déjà entendre que l'une des difficultés réside dans les hypothèses temporelles implicites / non dites.
Je dirais que vos déclarations ont la forme
1 expérience .x population event
En S1, la population correspond au nombre de décès et la spécification temporelle implicite est à présent ou "dans un délai suffisamment grand [pour disposer d'un nombre de cas suffisant] mais pas pour une période trop longue [pour avoir des caractéristiques d'accident de voiture à peu près constantes] par rapport au présent"
En S2, la population est composée de personnes. Et d'autres semblent interpréter cela non pas comme des "personnes mourantes" mais comme des "personnes vivantes" (ce qui, après tout, est ce que les gens font plus souvent / plus longtemps). Si vous considérez la population comme une population vivante, il est clair que pas une personne sur 80 ne décède "maintenant" dans un accident de voiture. Donc, cela se lit comme "quand ils meurent [peut-être dans quelques décennies], la cause de la mort est un accident de voiture".
Message à retenir: veillez toujours à préciser votre population et le dénominateur des fractions en général. (Gerd Gigerenzer a rédigé des articles sur le fait de ne pas préciser le dénominateur, ce qui est une cause majeure de confusion, en particulier dans les statistiques et la communication des risques).
la source
Pour moi, "1 sur 80 décès ..." est de loin la déclaration la plus claire. Le dénominateur dans votre "1 sur 80" est l'ensemble de tous les événements de la mort et cette déclaration le rend explicite.
Il y a de l'ambiguïté dans la formulation "1 personne sur 80 ...". Vous voulez vraiment dire "1 personne sur 80 qui meurt ...", mais la déclaration peut tout aussi bien être interprétée comme "1 personne sur 80 actuellement en vie ..." ou similaire.
Je suis tout à fait pour être explicite sur l'ensemble de référence dans les assertions de probabilité ou de fréquence comme celle-ci. Si vous parlez de la proportion de décès, dites «décès» et non «personnes».
la source
the 1/80 ratio does focus on the present time in particular
. Ou est-ce que je me trompe?Cela dépend si vous décrivez ou prédire .
"1 personne sur 80 mourra dans un accident de voiture" est une prédiction. Parmi toutes les personnes en vie aujourd'hui, une personne sur 80 mourra de cette façon.
"1 sur 80 décès sont causés par un accident de voiture" est une description. Parmi toutes les personnes décédées au cours d'une période donnée (p. Ex. La durée d'une étude complémentaire), 1 sur 80 est effectivement mort dans un accident de voiture.
Notez que la fenêtre temporelle est ambiguë. Une phrase implique que les décès ont déjà eu lieu; l'autre implique qu'ils se produiront un jour. Une phrase implique que votre population de base est constituée de personnes décédées (et qui étaient en vie auparavant); l'autre implique une population de base de personnes qui sont en vie aujourd'hui (et mourront éventuellement).
Ce sont en fait des déclarations totalement différentes, et une seule d'entre elles est probablement prise en charge par vos données source.
Sur une note de côté, l'ambiguïté provient d'un décalage entre l' état d'être une personne (qui se produit continuellement) et l' événement de la mort (qui se produit à un moment donné). Chaque fois que vous combinez les choses de cette manière, vous obtenez quelque chose qui est tout aussi ambigu. Vous pouvez résoudre instantanément l'ambiguïté en utilisant deux événements au lieu d'un état et d'un événement; par exemple, "Sur 80 personnes nées, 1 meurt dans un accident de voiture."
la source
Les deux déclarations sont différentes en raison du biais d'échantillonnage, car les accidents de voiture sont plus susceptibles de se produire lorsque les gens sont jeunes.
Faisons ceci plus concrètement en posant un scénario irréaliste.
Considérons les deux déclarations:
Nous montrerons que ces deux déclarations ne sont pas les mêmes.
Simplifions énormément les choses et supposons que chaque personne née mourra d'une crise cardiaque à 80 ans ou d'un accident de voiture à 40 ans. les décès équilibrent les naissances. Ensuite, il y aura trois populations humaines, toutes aussi grandes.
Ces trois populations doivent être également importantes, car le taux de décès dans les accidents de voiture (à partir de la première population ci-dessus) et le nombre de personnes décédant à la suite de crises cardiaques (à partir de la troisième population ci-dessus) sont égaux.
Ainsi, dans ce cas, seul un tiers des personnes en vie mourront dans un accident de voiture. Les deux déclarations ne sont donc pas identiques.
Dans la vraie vie, j’ai l’impression que les accidents de voiture se produisent beaucoup plus tôt que la plupart des autres causes de décès. Si tel est le cas, il y aura une différence substantielle entre les chiffres de votre déclaration un et deux.
Si vous avez modifié la deuxième déclaration en
alors, dans l'hypothèse d'une population en état d'équilibre, les deux déclarations seraient équivalentes. Mais bien sûr, dans le monde réel, nous n’avons pas de population à l’état stable, et un argument similaire (bien que plus compliqué) montre que pour une population en croissance ou en diminution, un biais d’échantillonnage différencie toujours ces deux déclarations.
la source
Non.
Disons que nous avons 800 personnes. 400 sont morts: 5 dans un accident de voiture, les 395 autres ont oublié de respirer. S1 est maintenant vrai: 5/400 = 1/80. S2 est faux: 5/800! = 1/80.
Le problème est que, techniquement, S2 est ambigu, car il ne spécifie pas le nombre total de décès, contrairement à S1. Alternativement, S1 a une information supplémentaire (nombre total de décès) et une information de moins (personnes totales). Pris au pied de la lettre, ils décrivent différents ratios.
En fait, je ne suis pas d'accord avec votre interprétation, mais je pense que cela n'a pas d'importance. Probablement, le contexte rendrait évident le sens.
Vous pourriez demander où vous pourriez éventuellement rencontrer des personnes qui ne meurent pas. D'une part, nous pourrions travailler avec un ensemble de données statistiques qui ne suivent que les personnes pendant 5 ans. Par conséquent, celles qui sont encore en vie à la fin de l'étude doivent être ignorées, car on ne sait pas de quoi elles vont mourir. Sinon, la cause du décès peut être inconnue, auquel cas vous ne pouvez pas l'affecter réellement à des voitures ou non.
"Une personne sur 80 qui meurent est victime d'un accident de voiture." ce qui revient à reformuler S1.
la source
Je conviens que votre interprétation de la deuxième déclaration est conforme à la première. Je conviens également que c'est une interprétation parfaitement raisonnable de la deuxième déclaration. Cela étant dit, la deuxième déclaration est beaucoup plus ambiguë.
La deuxième déclaration peut également être interprétée comme:
Les deuxième et troisième interprétations ci-dessus pourraient être assez proches pour un public profane, mais la première est très différente.
la source
La différence fondamentale est que les deux déclarations font référence à des populations humaines différentes et à des calendriers différents.
"Un décès sur 80 est causé par un accident de voiture" se réfère vraisemblablement à la proportion de décès sur une période assez limitée (disons un an). Étant donné que la proportion de la population totale utilisant des voitures et le bilan de sécurité des voitures ont tous deux considérablement changé au fil du temps, cette affirmation n’a aucun sens si vous n’indiquez pas à quel intervalle de temps il est fait référence. (À titre d'exemple ridicule, il aurait clairement été complètement faux de l'année 1919, compte tenu du niveau de possession et d'utilisation de la voiture dans la population totale à cette époque). Notez que la "proportion de la population totale utilisant des voitures" dans ce qui précède est en fait une erreur - cela devrait être "la proportion de personnes qui mourront dans un avenir proche en utilisant des voitures"
"Une personne sur 80 meurt des suites d'un accident de voiture", ce qui évoque vraisemblablement tous les êtres humains actuellement en vie dans une région et leur cause éventuelle de décès à une date ultérieure inconnue. Étant donné que la prévalence et la sécurité des déplacements en voiture changeront presque certainement au cours de leur vie (par exemple dans les 100 prochaines années, pour les nouveau-nés actuels), il s'agit d'une déclaration très différente de la première.
la source
A1) En supposant que tout le monde meurt et en supposant le contexte d’une période suffisamment courte autour de celle où les mesures ont été prises, oui, votre interprétation de S2 correspond à S1.
A2) Oui, votre interprétation de S2 est imprudente. S2 peut être interprété comme "1 personne sur 80 impliquée dans un accident de voiture meurt", ce qui n'est évidemment pas équivalent à S1. Par conséquent, l'utilisation de S2 pourrait être source de confusion.
Votre interprétation de 1 à 80 est raisonnable, bien que, et l'autre interprétation (1 tout 80) est très inhabituelle. "1 sur N de U est P" est un raccourci très courant pour "étant donné un prédicat, P et N échantillons aléatoires, x, de l'univers U, le nombre d'échantillons attendu tel que P (x) soit vrai est approximativement égal à 1" .
A3) Hors de toutes les personnes, 1 sur 80 meurt à la suite d'un accident de voiture.
la source
Oui, c'est faux, et aucune formulation ne semble suffisante pour transmettre systématiquement le sens souhaité
En tant que profane, si votre cible est laïque, je recommanderais certainement de poster sur https://english.stackexchange.com/ plutôt qu'ici - votre question m'a pris quelques lectures pour comprendre ce que S1 et S2 signifient intuitivement pour moi vs ce que vous vouliez dire.
Pour mémoire, mes interprétations de chaque affirmation:
(S1) - pour 80 décès, 1 décès par accident de voiture
(S2) - Pour 80 personnes dans un accident de voiture, 1 décès
Pour exprimer votre sens, j'utiliserais probablement un S2 modifié: "Une personne sur 80 mourra dans un accident de voiture."
Cela contient encore une certaine ambiguïté, mais conserve une brièveté similaire.
la source