Est-il erroné de reformuler «1 décès sur 80 est dû à un accident de voiture» car «1 personne sur 80 meurt des suites d'un accident de voiture?

56
  • Première déclaration (S1): "Un décès sur 80 est causé par un accident de voiture."
  • Deuxième déclaration (S2): "Une personne sur 80 meurt des suites d'un accident de voiture."

Personnellement, je ne vois pas beaucoup de différence entre ces deux déclarations. En écrivant, je les considèrerais comme interchangeables pour un public laïc. Cependant, deux personnes m'ont lancé un défi à ce sujet et je recherche une perspective supplémentaire.

Mon interprétation par défaut de S2 est la suivante: "Sur 80 personnes tirées uniformément de la population humaine, nous nous attendrions à ce qu’une d’elles meure des suites d’un accident de voiture" - et j’estime que cette affirmation qualifiée est équivalente à S1.

Mes questions sont les suivantes:

  • Q1) Est-ce que mon interprétation par défaut est équivalente à Statement One?

  • Q2) Est-ce inhabituel ou téméraire que ce soit mon interprétation par défaut?

  • Q3) Si vous pensez que S1 et S2 sont différents, de manière à indiquer le second quand on veut dire que le premier est trompeur / incorrect, pourriez-vous fournir une révision complète et qualifiée de S2 équivalente?

Laissons de côté le casse-tête évident selon lequel S1 ne fait pas spécifiquement référence à des morts humaines et supposons que cela soit compris dans son contexte. Laissons également de côté toute discussion sur la véracité de la revendication elle-même: elle se veut illustrative.

Autant que je sache, les désaccords que j'ai entendus jusqu'à présent semblent se centrer sur le fait de ne pas adopter différentes interprétations des première et deuxième déclarations.

Pour le premier, mes challengers semblent l’interpréter comme 1/80 * num_deaths = nombre de décès causés par des accidents de voiture, mais pour une raison quelconque, une interprétation différente du second du type "si vous avez un ensemble de 80 personnes, l' un d'entre eux va mourir dans un accident de voiture »( ce qui est évidemment pas une réclamation équivalente). Je pense que compte tenu de leur interprétation de S1, leur valeur par défaut pour S2 serait de le lire comme suit: (1/80 * num_dead_people = nombre de personnes décédées dans un accident de voiture == nombre de décès causés par un accident de voiture). Je ne sais pas pourquoi la divergence d'interprétation (leur hypothèse par défaut pour S2 est une hypothèse beaucoup plus forte), ou s'ils ont un sens statistique inné qui me manque en fait.

faulty_ram_sticks
la source
19
"Si vous avez un groupe de 80 personnes, l'une d'entre elles mourra dans un accident de voiture" - si c'est ainsi qu'ils comprennent cette déclaration, alors j'ai une très vieille blague sur 1 enfant sur 3, chinois, qu'ils sont va absolument aimer .
Steve Jessop
3
Ceci est très similaire à la différence entre la prévalence et l'incidence . Comme d'autres l'ont noté, "est causée" se rapporte à un état fini, et "meurt" au présent ou au futur.
Sextus Empiricus
5
S2 ne dit pas clairement que les 79 autres sont décédés. Certains ou tous les 79 autres pourraient être en vie. S1 dit "1 sur 80 décès", ce qui montre clairement que tous les 80 membres du groupe sont décédés.
Michael Chernick le
5
En tant que laïc, sans connaître le contexte, j'interpréterais S1 comme: "sur toutes les causes de décès pour la population X, 1/80 est dû à un accident de voiture", alors que S2 me lit: "sur toutes les personnes impliquées. dans les accidents de voiture, 1 sur 80 meurt à cause de cela ".
Gnudiff le
5
(S2): "Une personne sur 80 meurt des suites d'un accident de voiture." me semble ambigu. S'agit-il d'une personne sur 80 victime d' un accident de la route ou d'une personne sur 80?
Bill the Lizard

Réponses:

67

Tout d'abord, ma première pensée intuitive était: "S2 ne peut être identique à S1 que si le taux de mortalité par le trafic reste constant, éventuellement sur des décennies" - ce qui n'aurait certainement pas été une bonne hypothèse au cours des dernières décennies. Cela laisse déjà entendre que l'une des difficultés réside dans les hypothèses temporelles implicites / non dites.

Je dirais que vos déclarations ont la forme

1 expérience .x populationevent

En S1, la population correspond au nombre de décès et la spécification temporelle implicite est à présent ou "dans un délai suffisamment grand [pour disposer d'un nombre de cas suffisant] mais pas pour une période trop longue [pour avoir des caractéristiques d'accident de voiture à peu près constantes] par rapport au présent"

En S2, la population est composée de personnes. Et d'autres semblent interpréter cela non pas comme des "personnes mourantes" mais comme des "personnes vivantes" (ce qui, après tout, est ce que les gens font plus souvent / plus longtemps). Si vous considérez la population comme une population vivante, il est clair que pas une personne sur 80 ne décède "maintenant" dans un accident de voiture. Donc, cela se lit comme "quand ils meurent [peut-être dans quelques décennies], la cause de la mort est un accident de voiture".

Message à retenir: veillez toujours à préciser votre population et le dénominateur des fractions en général. (Gerd Gigerenzer a rédigé des articles sur le fait de ne pas préciser le dénominateur, ce qui est une cause majeure de confusion, en particulier dans les statistiques et la communication des risques).

cbeleites soutient Monica
la source
1
"En S1, la population correspond au nombre de décès et la spécification temporelle implicite est à présent ou" dans un délai suffisamment grand [pour que le nombre de cas soit suffisant] mais pas pour une période trop longue [pour que les caractéristiques de l'accident de voiture soient à peu près constantes] "- En examinant toutes les (merveilleuses) réponses que j'ai reçues, je pense que cela touche le fond du problème. J'ai été doublement surpris de la grande variété de façons dont les gens peuvent utiliser la deuxième déclaration, et beaucoup ont ouvert mon Je suis
attentif
faulty_ram_sticks: Merci pour les fleurs :-) Et ces deux spécifications de population possibles que j'ai faites à partir de S2 ne sont de loin pas les seules. un (longitudinalement). Etc.
cbeleites soutient Monica le
@cbeleites fleurs? quelles fleurs? : - /
Le grand canard le
1
Puis -je souligner également que l'utilisation de « décès est causé » et « personnes meurt » est source de confusion / mauvais libellé comme sensation well.I comme quand une statistique décrit , il devrait être « décès ont été causés » et « les gens sont morts ». Cela signifie sans ambiguïté que vous décrivez un événement passé plutôt que de faire une prédiction. Bien sûr, on pourrait aussi dire que "les gens vont mourir" pour dire que les statistiques permettent de croire qu’un certain pourcentage de la population actuelle mourra des suites d’un accident de voiture. Je donne ces exemples ici pour référence future car ils ne constituent pas une réponse en soi.
Le grand canard
Mais dire qu'un pourcentage de décès est causé me trouble parce que cela décrit le présent comme si l'événement se produisait maintenant ou quelque chose du genre. Si je voyais cela, je le considérerais comme un libellé médiocre, mais probablement pas très informatif. Toutefois, comme il s’agit d’une discussion sur le libellé, j’ai pensé que je devrais en parler.
Le grand canard
80

Pour moi, "1 sur 80 décès ..." est de loin la déclaration la plus claire. Le dénominateur dans votre "1 sur 80" est l'ensemble de tous les événements de la mort et cette déclaration le rend explicite.

Il y a de l'ambiguïté dans la formulation "1 personne sur 80 ...". Vous voulez vraiment dire "1 personne sur 80 qui meurt ...", mais la déclaration peut tout aussi bien être interprétée comme "1 personne sur 80 actuellement en vie ..." ou similaire.

Je suis tout à fait pour être explicite sur l'ensemble de référence dans les assertions de probabilité ou de fréquence comme celle-ci. Si vous parlez de la proportion de décès, dites «décès» et non «personnes».

Brent Hutto
la source
31
"" 1 personne sur 80 qui meurt ... "- étant donné que l'immortalité n'existe pas, nous pouvons supposer en toute sécurité que le groupe de personnes qui mourra est le même groupe que tout le monde. Vous auriez besoin d'un qualificatif supplémentaire, par exemple "Des gens qui mourront l'année prochaine "
MSalters
16
@Msalters Les déclarations sont au présent, elles revendiquent donc le taux actuel.
Accumulation le
6
Techniquement, je pense que "1 personne sur 80" est plus spécifique, car il y a beaucoup plus de morts que de personnes: morts d'oiseaux, de bactéries, de pédantisme, ...
Kimball
2
@ Pere: Je ne comprends pas tout à fait, suivez, vous dites la même chose que lorsque j'ai dit the 1/80 ratio does focus on the present time in particular. Ou est-ce que je me trompe?
Flater
3
(Sur la note d'ambiguïté possible) Du point de vue de la langue anglaise; Je pense qu'un malentendu plus commun (et plus grave) serait de lire S2 comme signifiant "1 personne sur 80 qui a un accident de voiture mourra dans cet accident" (c'est-à-dire "1 accident de voiture sur 80 est mortel") - ce qui est une revendication très différente.
Bilkokuya le
43

Cela dépend si vous décrivez ou prédire .

"1 personne sur 80 mourra dans un accident de voiture" est une prédiction. Parmi toutes les personnes en vie aujourd'hui, une personne sur 80 mourra de cette façon.

"1 sur 80 décès sont causés par un accident de voiture" est une description. Parmi toutes les personnes décédées au cours d'une période donnée (p. Ex. La durée d'une étude complémentaire), 1 sur 80 est effectivement mort dans un accident de voiture.

Notez que la fenêtre temporelle est ambiguë. Une phrase implique que les décès ont déjà eu lieu; l'autre implique qu'ils se produiront un jour. Une phrase implique que votre population de base est constituée de personnes décédées (et qui étaient en vie auparavant); l'autre implique une population de base de personnes qui sont en vie aujourd'hui (et mourront éventuellement).

Ce sont en fait des déclarations totalement différentes, et une seule d'entre elles est probablement prise en charge par vos données source.

Sur une note de côté, l'ambiguïté provient d'un décalage entre l' état d'être une personne (qui se produit continuellement) et l' événement de la mort (qui se produit à un moment donné). Chaque fois que vous combinez les choses de cette manière, vous obtenez quelque chose qui est tout aussi ambigu. Vous pouvez résoudre instantanément l'ambiguïté en utilisant deux événements au lieu d'un état et d'un événement; par exemple, "Sur 80 personnes nées, 1 meurt dans un accident de voiture."

John Wu
la source
1
En plus d’être une prédiction, cela pourrait bizarrement être interprété comme une menace. La lecture de cette réponse m'a fait penser au xkcd pertinent .
Wildcard
3
"Aujourd'hui, un accident de voiture est à l'origine de 80 décès. Cependant, compte tenu de l'amélioration rapide de la technologie des véhicules et des routes et du passage progressif aux autres modes de transport, nous nous attendons à ce que ce nombre chute à un sur 120 d'ici 2050, et un sur 150 d’ici à 2100. Ainsi, parmi les personnes en vie aujourd’hui, un sur 135 seulement mourra dans un accident de voiture ".
Michael Kay
21

Les deux déclarations sont différentes en raison du biais d'échantillonnage, car les accidents de voiture sont plus susceptibles de se produire lorsque les gens sont jeunes.

Faisons ceci plus concrètement en posant un scénario irréaliste.

Considérons les deux déclarations:

  • La moitié des décès sont causés par un accident de voiture.
  • La moitié des personnes en vie aujourd'hui mourront dans un accident de voiture.

Nous montrerons que ces deux déclarations ne sont pas les mêmes.

Simplifions énormément les choses et supposons que chaque personne née mourra d'une crise cardiaque à 80 ans ou d'un accident de voiture à 40 ans. les décès équilibrent les naissances. Ensuite, il y aura trois populations humaines, toutes aussi grandes.

  • Les personnes de moins de 40 ans qui mourront d'un accident de voiture.
  • Les personnes de moins de 40 ans qui mourront d'une crise cardiaque.
  • Les personnes de plus de 40 ans qui mourront d'une crise cardiaque.

Ces trois populations doivent être également importantes, car le taux de décès dans les accidents de voiture (à partir de la première population ci-dessus) et le nombre de personnes décédant à la suite de crises cardiaques (à partir de la troisième population ci-dessus) sont égaux.

1/401/40

Ainsi, dans ce cas, seul un tiers des personnes en vie mourront dans un accident de voiture. Les deux déclarations ne sont donc pas identiques.

Dans la vraie vie, j’ai l’impression que les accidents de voiture se produisent beaucoup plus tôt que la plupart des autres causes de décès. Si tel est le cas, il y aura une différence substantielle entre les chiffres de votre déclaration un et deux.

Si vous avez modifié la deuxième déclaration en

  • La moitié des personnes nées mourront dans un accident de voiture,

alors, dans l'hypothèse d'une population en état d'équilibre, les deux déclarations seraient équivalentes. Mais bien sûr, dans le monde réel, nous n’avons pas de population à l’état stable, et un argument similaire (bien que plus compliqué) montre que pour une population en croissance ou en diminution, un biais d’échantillonnage différencie toujours ces deux déclarations.

Peter Shor
la source
"Ces trois populations doivent être tout aussi importantes car le taux de décès par crise cardiaque (à partir de la première population ci-dessus) et le nombre de décès par crise cardiaque (à partir de la troisième population ci-dessus) sont égaux." Pensez-vous que vous pourriez rendre cela un peu plus évident? (En outre, je suppose que vous voulez parler des accidents de voiture pour la première population). Sinon, ceci est un excellent exemple. Je n'avais même pas pensé qu'il pouvait y avoir une différence entre "La moitié des personnes nées" et "La moitié des personnes en vie".
faulty_ram_sticks
@faulty_ram_sticks. Oui: le biais d'échantillonnage peut être délicat. Je l'ai expliqué plus en détail ... J'espère que c'est assez bon maintenant. Et merci d'avoir attrapé ma faute de frappe.
Peter Shor
5
C'est une excellente question de biais d'échantillonnage. Le fait que les 8 premières réponses n'aient pas capturé le biais d'échantillonnage montre que c'est vraiment délicat. Je peux l'utiliser quand j'enseigne la probabilité.
Peter Shor
Argument clair, très bien construit, et qui n'invalide pas théoriquement l’intuition de l’équivalence du PO d’une manière à laquelle il n’a probablement même pas pensé.
Peter - Réintégrer Monica le
12

Mon interprétation par défaut est-elle vraiment équivalente à celle de l'état un?

Non.

Disons que nous avons 800 personnes. 400 sont morts: 5 dans un accident de voiture, les 395 autres ont oublié de respirer. S1 est maintenant vrai: 5/400 = 1/80. S2 est faux: 5/800! = 1/80.

Le problème est que, techniquement, S2 est ambigu, car il ne spécifie pas le nombre total de décès, contrairement à S1. Alternativement, S1 a une information supplémentaire (nombre total de décès) et une information de moins (personnes totales). Pris au pied de la lettre, ils décrivent différents ratios.

Est-ce inhabituel ou téméraire que ce soit mon interprétation par défaut?

En fait, je ne suis pas d'accord avec votre interprétation, mais je pense que cela n'a pas d'importance. Probablement, le contexte rendrait évident le sens.

  • D'une part, toutes les personnes meurent, il est donc implicite que le nombre total de personnes = le nombre total de décès. Donc, si vous discutez des taux de décès en général, votre interprétation par défaut s’applique.
  • D'autre part, si vous parlez d'un ensemble de données limité dans lequel il n'est pas certain que tout le monde meurt, mon interprétation ci-dessus est plus précise. Mais il ne semble pas difficile pour le lecteur de l’ignorer.

Vous pourriez demander où vous pourriez éventuellement rencontrer des personnes qui ne meurent pas. D'une part, nous pourrions travailler avec un ensemble de données statistiques qui ne suivent que les personnes pendant 5 ans. Par conséquent, celles qui sont encore en vie à la fin de l'étude doivent être ignorées, car on ne sait pas de quoi elles vont mourir. Sinon, la cause du décès peut être inconnue, auquel cas vous ne pouvez pas l'affecter réellement à des voitures ou non.

Si vous pensez que S1 et S2 sont différents, de sorte que vous devez indiquer le second quand on veut dire que le premier est trompeur / incorrect, pourriez-vous fournir une révision complète et qualifiée de S2 qui soit équivalente?

"Une personne sur 80 qui meurent est victime d'un accident de voiture." ce qui revient à reformuler S1.

Cloons
la source
yy
Mais ce n'était qu'un sidenote. Ce que je voulais dire, c’est que cette réponse ne fait que souligner un problème sémantique mais ne tient pas compte du problème statistique qui concerne la situation dans laquelle la probabilité qu’un décès soit causé par un accident de voiture n’est pas constante, indépendamment du temps. Cela rend les choses différentes lorsque nous nous référons à «est causée» (le passé) et «(mourra)» (le présent ou l'avenir).
Sextus Empiricus
"Cause de décès" est un terme médico-légal qui prend un temps latent pour établir médicalement, rapporter, et collecter. On ne peut le dire que rétrospectivement lorsque la probabilité de rater une cause de décès est faible, sinon on corrige les données manquantes, par exemple en incluant les déclarations tardives de la période de déclaration précédente. Ainsi, une déclaration statistiquement appropriée ressemble à ceci: "Dans la région de collecte de données géographiques pendant une période donnée , les probabilités de décès imputables à des accidents de voiture étaient estimées à un sur 80 décès".
Carl
7

Je conviens que votre interprétation de la deuxième déclaration est conforme à la première. Je conviens également que c'est une interprétation parfaitement raisonnable de la deuxième déclaration. Cela étant dit, la deuxième déclaration est beaucoup plus ambiguë.

La deuxième déclaration peut également être interprétée comme:

  • Sur un échantillon de personnes impliquées dans un récent accident de voiture, 1/80 est décédé.
  • Sur un échantillon de population large, 1/80 décèdera en raison de facteurs liés à un accident de voiture, certains d'entre eux étant les accidents eux-mêmes, d'autres étant des suicides, des blessures, des fautes médicales, une justice d'autodéfense, etc.
  • L'extrapolation des tendances actuelles en matière de sécurité indique que 1/80 des personnes en vie mourront des suites d'un accident de voiture.

Les deuxième et troisième interprétations ci-dessus pourraient être assez proches pour un public profane, mais la première est très différente.

Alex H.
la source
2
La première interprétation «1/80 de toutes les victimes d’un accident de voiture meurent des suites de cet accident» est la façon dont j’ai interprété la deuxième déclaration au début. Bien que je ne pense pas que ce soit une interprétation correcte et ressemble davantage à une lecture superficielle.
Sextus Empiricus
5

La différence fondamentale est que les deux déclarations font référence à des populations humaines différentes et à des calendriers différents.

"Un décès sur 80 est causé par un accident de voiture" se réfère vraisemblablement à la proportion de décès sur une période assez limitée (disons un an). Étant donné que la proportion de la population totale utilisant des voitures et le bilan de sécurité des voitures ont tous deux considérablement changé au fil du temps, cette affirmation n’a aucun sens si vous n’indiquez pas à quel intervalle de temps il est fait référence. (À titre d'exemple ridicule, il aurait clairement été complètement faux de l'année 1919, compte tenu du niveau de possession et d'utilisation de la voiture dans la population totale à cette époque). Notez que la "proportion de la population totale utilisant des voitures" dans ce qui précède est en fait une erreur - cela devrait être "la proportion de personnes qui mourront dans un avenir proche en utilisant des voitures"

"Une personne sur 80 meurt des suites d'un accident de voiture", ce qui évoque vraisemblablement tous les êtres humains actuellement en vie dans une région et leur cause éventuelle de décès à une date ultérieure inconnue. Étant donné que la prévalence et la sécurité des déplacements en voiture changeront presque certainement au cours de leur vie (par exemple dans les 100 prochaines années, pour les nouveau-nés actuels), il s'agit d'une déclaration très différente de la première.

Alephzero
la source
3

A1) En supposant que tout le monde meurt et en supposant le contexte d’une période suffisamment courte autour de celle où les mesures ont été prises, oui, votre interprétation de S2 correspond à S1.

A2) Oui, votre interprétation de S2 est imprudente. S2 peut être interprété comme "1 personne sur 80 impliquée dans un accident de voiture meurt", ce qui n'est évidemment pas équivalent à S1. Par conséquent, l'utilisation de S2 pourrait être source de confusion.

Votre interprétation de 1 à 80 est raisonnable, bien que, et l'autre interprétation (1 tout 80) est très inhabituelle. "1 sur N de U est P" est un raccourci très courant pour "étant donné un prédicat, P et N échantillons aléatoires, x, de l'univers U, le nombre d'échantillons attendu tel que P (x) soit vrai est approximativement égal à 1" .

A3) Hors de toutes les personnes, 1 sur 80 meurt à la suite d'un accident de voiture.

Vaelus
la source
Vous n'expliquez pas votre réponse à A1. Pourtant, il y a eu des réponses à d'autres problèmes (non à A1). Pourriez-vous expliquer pourquoi cela ne va pas?
Sextus Empiricus
@ MartijnWeterings La seule réponse qui dit non à A1 semble être en désaccord sur le motif que, sur une période de temps limitée, tous ne meurent pas nécessairement. Pensez-vous que mon édition adresse ceci?
Vaelus
Je pense que la phrase qui n'indique pas que les 79 autres personnes sont décédées d'autres causes est donc ambiguë. Il est donc préférable de déclarer l'autre.
Michael Chernick le
Vaelus, il y a une autre raison de dire «non» à A1. Cette raison est que la fraction des décès dus à des accidents de voiture peut ne pas avoir besoin d'être constante dans le temps, elle est donc ambiguë, et S1 et S2 ont une perspective différente en ce qui concerne cette expression (non constante).
Sextus Empiricus le
-1

Oui, c'est faux, et aucune formulation ne semble suffisante pour transmettre systématiquement le sens souhaité

En tant que profane, si votre cible est laïque, je recommanderais certainement de poster sur https://english.stackexchange.com/ plutôt qu'ici - votre question m'a pris quelques lectures pour comprendre ce que S1 et S2 signifient intuitivement pour moi vs ce que vous vouliez dire.

Pour mémoire, mes interprétations de chaque affirmation:

  • (S1) - pour 80 décès, 1 décès par accident de voiture

  • (S2) - Pour 80 personnes dans un accident de voiture, 1 décès

Pour exprimer votre sens, j'utiliserais probablement un S2 modifié: "Une personne sur 80 mourra dans un accident de voiture."

Cela contient encore une certaine ambiguïté, mais conserve une brièveté similaire.

ap55
la source
Ceci est un commentaire et non une réponse.
Michael Chernick
1
@ Michael Désolé, comment? Je ne demande pas d’éclaircissements, ni de fautes de frappe ou quoi que ce soit - merci de me faire savoir si la modification aide.
ap55