Considérez les déclarations suivantes par le Titanic:
Hypothèse 1: seuls des hommes et des femmes étaient à bord
Hypothèse 2: il y avait un grand nombre d'hommes et de femmes
Énoncé 1: 90% de toutes les femmes ont survécu
Énoncé 2: 90% de tous ceux qui ont survécu étaient des femmes
Le premier indique que sauver les femmes était probablement hautement prioritaire (indépendamment du fait que ce soit ou non des hommes)
Quand la deuxième statistique est-elle utile?
Peut-on dire que l'un d'eux est presque toujours plus utile que l'autre?
Réponses:
En l'état, aucun des énoncés 1 ou 2 n'est très utile. Si 90% des passagers étaient des femmes et 90% des personnes ont survécu au hasard, alors les deux affirmations seraient vraies. Les déclarations doivent être considérées dans le contexte de la composition globale des passagers. Et la chance globale de survivre.
Supposons que nous ayons autant d'hommes que de femmes, 100 chacun. Voici quelques matrices possibles d'hommes (M) contre des femmes (W) et de survivants (S) contre des morts (D):
90% des femmes ont survécu. Comme 90% des hommes. La déclaration 1 est vraie, la déclaration 2 est fausse, car la moitié des survivants étaient des femmes. Ceci est cohérent avec de nombreux survivants, mais aucune différence entre les sexes .
90% des femmes ont survécu, mais seulement 10% des hommes. 90% des survivants étaient des femmes. Les deux affirmations sont vraies. Cela correspond à une différence entre les sexes : les femmes étaient plus susceptibles de survivre que les hommes.
9% des femmes ont survécu, mais seulement 1% des hommes. 90% des survivants étaient des femmes. L'énoncé 1 est faux, l'énoncé 2 est vrai. Cela est à nouveau cohérent avec une différence entre les sexes : les femmes étaient plus susceptibles de survivre que les hommes.
la source
(or indeed, if *everyone* survived)...
Si tout le monde a survécu, 100% de toutes les femmes ont survécu, quelles que soient les proportions.À première vue, la probabilité conditionnelle de survie conditionnelle au sexe est plus utile, simplement en raison de la direction du flux d'information. Le sexe d'une personne est connu avant son statut de survie, et cette probabilité peut être utilisée dans un sens prédictif, de manière prospective. De plus, il n'est pas influencé par la prévalence des femmes. En cas de doute, pensez à la prédiction.
la source
Le mot «priorité» vient du latin pour «avant». Une priorité est quelque chose qui vient avant quelque chose d'autre (où "avant" est utilisé dans le sens de "plus important"). Si vous dites que sauver les femmes était une priorité, alors sauver les femmes doit passer avant autre chose. Et l'hypothèse naturelle est que ce qui précède est de sauver les hommes. Si vous dites "indépendamment du fait de savoir si sauver les hommes était", alors nous nous demandons ce que cela a été avant.
Que les femmes aient un taux de survie élevé ne dit pas grand-chose, si nous ne savons pas quel était le taux de survie général. Le dernier navire sur lequel j'étais, plus de 90% des femmes ont survécu, mais je ne qualifierais pas cela de montrer que sauver les femmes était une priorité.
Et savoir quel pourcentage de survivantes étaient des femmes ne dit pas grand-chose sans savoir quel pourcentage de personnes dans l'ensemble étaient des femmes.
La statistique la plus utile dépend vraiment de la situation. Si vous voulez savoir à quel point quelque chose est dangereux, le taux de mortalité est plus important. Si vous voulez savoir ce qui affecte la dangerosité de quelque chose, alors la répartition en pourcentage des victimes est importante.
la source
Il est peut-être utile pour nous d'examiner comment ces probabilités sont liées.
Laisser l'événement où une personne est une femme, et soit SW S l'événement où une personne a survécu.
Énoncé 1:
Énoncé 2:
Le théorème de Bayes illustre comment ces énoncés de probabilité sont liés.
la source
Cela dépend de ce que l'on considère utile.
D'un autre côté, si vous vous demandez pourquoi les histoires de survivants proviennent principalement de femmes, la déclaration 2 expliquerait cela, rendant la déclaration 2 utile même en l'absence d'autres informations.
Je ne vois rien d'énoncé 1 qui soit utile hors contexte. Cela ne dit certainement rien sur la priorité accordée à la sauvegarde des femmes, par rapport à toute autre chose. La seule chose que l'énoncé 1 fait pour moi, c'est qu'il me fait dire "dis m'en plus".
la source
En surface (ou isolément de la réalité), les deux déclarations semblent également inutiles pour l'objectif de l'État. Cependant, compte tenu du contexte, la deuxième déclaration est clairement plus utile.
Énoncé 2
Nous testons l'hypoH0: x > z
Réécrivons l'équation pour obtenir les conditions nécessaires àH0 :
So, for your hypo that women were more likely to survive, all you need is to check that there were less than 90% women among the passengers. This is consistent with your assumption 2, which seems to imply thatp≈1/2 . Hence, I declare that statement 2 all but asserts that women were more likely to survive, i.e. it's quite useful for your goal.
Statement 1
The first statement is truly useless in isolation, but has a limited use in the context. If we pretend we know nothing about the event, then saying thatx=0.9 tells us nothing about z , and whether x>z ?
However, from that little that I know about the event - I haven't seen the movie - it seems unlikely thatx≤z . Why?
We know from Assumption 2 thatp≈1/2 , so the total survival rate is
px+(1−p)z . If we assume that x≈z and p≈1/2 we get
Conclusion
I'd say that both statements support your hypo that women were more likely to survive than men, but Statement 1 does so rather weakly, while Statement 2 in combination with assumptions almost surely establishes your hypo as a fact.
la source