Question originale (25/07/14): Cette citation des médias est-elle logique, ou existe-t-il une meilleure façon statistique de visualiser la série d'accidents d'avion récents?
Cependant, Barnett attire également l'attention sur la théorie de la distribution de Poisson, ce qui implique que les intervalles courts entre les accidents sont en fait plus probables que les longs.
"Supposons qu'il y ait en moyenne un accident mortel par an, ce qui signifie que le risque d'accident un jour donné est de un sur 365", explique Barnett. "S'il y a un crash le 1er août, la chance que le prochain crash se produise un jour plus tard le 2 août est 1/365. Mais la chance que le prochain crash soit le 3 août est (364/365) x (1/365) , car le prochain crash ne se produit le 3 août que s'il n'y a pas de crash le 2 août. "
"Cela semble contre-intuitif, mais la conclusion découle sans relâche des lois de la probabilité", dit Barnett.
Source: http://www.bbc.com/news/magazine-28481060
Clarification (27/07/14): Ce qui est contre-intuitif (pour moi), c'est que les événements rares ont tendance à se produire dans le temps. Intuitivement, je pense que des événements rares ne se produiraient pas à temps. Quelqu'un peut-il m'indiquer une distribution théorique ou empirique attendue du temps entre les événements sous les hypothèses d'une distribution de Poisson? (C'est-à-dire un histogramme où l'axe des ordonnées est la fréquence ou la probabilité et l'axe des abscisses le temps entre 2 occurrences consécutives regroupées en jours, semaines, mois ou années, etc.) Merci.
Clarification (28/07/14): Le titre laisse entendre qu'il est plus susceptible d'avoir des grappes d'accidents que des accidents largement espacés. Permet de rendre cela opérationnel. Disons qu'un cluster est composé de 3 accidents d'avion, qu'une courte période de temps est de 3 mois et une longue période de temps de 3 ans. Il semble illogique de penser qu'il y a une probabilité plus élevée que 3 accidents se produisent dans une période de 3 mois que dans une période de 3 ans. Même si nous considérons le premier accident comme acquis, il est illogique de penser que 2 autres accidents se produiront au cours des 3 prochains mois par rapport aux 3 prochaines années. Si cela est vrai, alors le titre des médias est trompeur et incorrect. Suis-je en train de manquer quelque chose?
la source
Réponses:
Résumé: La première phrase du paragraphe cité de la BBC est bâclée et trompeuse.
Même si les réponses et commentaires précédents ont déjà fourni une excellente discussion, j'estime que la question principale n'a pas reçu de réponse satisfaisante.
Donc , supposons que la probabilité d'un accident d'avion un jour donné est et que les accidents sont indépendants les uns des autres. Supposons en outre qu'un avion s'est écrasé le 1er janvier. Quand le prochain avion s'écraserait-il?p = une / 365
Eh bien, faisons une simulation simple: pour chaque jour des trois prochaines années, je déciderai au hasard si un autre avion s'est écrasé avec la probabilité et je noterai le jour du prochain accident; Je vais répéter cette procédure 100p fois. Voici l'histogramme résultant:100000
Voici un autre histogramme pour vraiment faire passer ce point. Il s'agit simplement d'une somme de l'histogramme précédent sur plusieurs périodes non croisées:
la source
Ce que le journaliste dit, c'est que l'occurrence aléatoire d'un accident d'avion peut être modélisée comme processus de Poisson - une situation où la probabilité qu'un événement se produise sur un (petit) intervalle soit proportionnelle à la longueur dudit intervalle et où chaque occurrence en Indépendant de tous les autres.
Est-ce un modèle raisonnable pour le scénario décrit?
Probablement.
Bien sûr, ces événements pourraient ne pas être indépendants à 100%, car d'autres pilotes modifient probablement leur comportement (ne serait-ce que très légèrement) après un accident. [Je ne sais pas - peut-être que quelques pilotes font une formation supplémentaire sur simulateur ou quelque chose comme ça]. Néanmoins, l'hypothèse de indépendance est toujours tout à fait raisonnable.
Qu'en est-il des grappes d'accidents d'avion?
Oui. Étant donné un processus de Poisson (ou même un autre processus aléatoire), vous voulez attendre à voir quelques grappes d'occurrences.
En fait, comme décrit par le Oxford Dictionary of Statistics dans son entrée pour Poisson Process (qui est une "description mathématique du caractère aléatoire"):
Par exemple, consultez ce simple morceau de code R :
qui produit:
Même si nous savons qu'il s'agit d'un tracé de points aléatoires, il semble qu'il y ait des bits non aléatoires - en particulier, dans certaines parties du graphique, il y a des blocs de points tandis que d'autres parties sont grandes ouvertes. C'est ce même type de comportement que l'article essaie de décrire (uniquement avec des données de séries chronologiques et non des données spatiales ).
MISE À JOUR:
@JoelW .: Donc, par exemple, disons que la probabilité qu'un avion s'écrase demain (ou n'importe quel jour d'ailleurs) est " p " (et, disons " p " est quelque chose comme 1 sur cent).
La raison pour laquelle le prochain accident d'avion est plus susceptible de se produire demain que dans un an exactement (c.-à-d. Le 26 juillet 2015 ) est que la probabilité que le prochain accident se produise dans exactement un an est égale à:
Ça a du sens?
En fin de compte, je pense que la raison pour laquelle ces choses sont contre-intuitif est parce que généralement quand on pense à une phrase comme:
"The odds of a plane crash in one month compared with the odds of one happening tomorrow"
. Naturellement, nous ne considérons pas immédiatement la période de 24 heures qui commence dans exactement un mois. Au lieu de cela, nous (ou du moins je le fais) avons tendance à y penser de manière plus, eh bien, de manière flexible . Donc plus comme:a month ± a week
. Cela et le fait que nous oublions de prendre en compte les chances d'un crash qui ne se produit pas dans l'intervalle ... (Mais encore une fois, c'est peut-être juste moi ...).Phew!
Ressources supplémentaires:
la source
Si le nombre d'accidents d'avion est distribué par Poisson (comme il semble le dire), le temps entre les accidents a une distribution exponentielle. Le pdf de la distribution exponentielle est une fonction monotone décroissante du temps. Par conséquent, les plantages antérieurs sont plus susceptibles que les plantages ultérieurs.
la source
Les autres réponses ont déjà traité du degré d' indépendance événements se regroupent. (Lire le chaos de Gleick, il y a toutes ces années, m'a ouvert les yeux sur cette idée.)
Mais, en fait, il existe des preuves solides que les accidents d'avion ne sont pas des événements indépendants. L'influence de Cialdini a un très bon chapitre à ce sujet (également mentionné ici qui a quelques liens vers des données; et j'ai trouvé un extrait de cette partie du livre ). Évidemment, cela est très controversé: il dit essentiellement que plus un accident d'avion est médiatisé, plus il est probable qu'il influence un pilote (consciemment ou inconsciemment) à écraser son avion. Mais les explications psychologiques qui sous-tendent l'hypothèse semblent plausibles et les données semblent également la soutenir.
(Des liens vers des recherches de démystification basées sur des statistiques seraient les bienvenus dans les commentaires.)
la source