L'article The Odds, Continually Updated mentionne l'histoire d'un pêcheur de Long Island qui doit littéralement sa vie à Bayesian Statistics. Voici la version courte:
Il y a deux pêcheurs sur un bateau au milieu de la nuit. Pendant que l'un est endormi, l'autre tombe dans l'océan. Le bateau continue de rouler sur le pilote automatique tout au long de la nuit jusqu'à ce que le premier gars se réveille enfin et informe la Garde côtière. La Garde côtière utilise un logiciel appelé SAROPS (Search and Rescue Optimal Planning System) pour le trouver juste à temps, car il était hypothermique et presque à court d'énergie pour rester à flot.
Voici la version longue: Un point dans la mer
Je voulais en savoir plus sur la façon dont le théorème de Bayes est réellement appliqué ici. J'ai découvert pas mal de choses sur le logiciel SAROPS juste en faisant des recherches sur Google.
Le simulateur SAROPS
Le composant simulateur prend en compte des données opportunes telles que le courant océanique, le vent, etc. et simule des milliers de chemins de dérive possibles. À partir de ces trajectoires de dérive, une carte de distribution de probabilité est créée.
Notez que les graphiques suivants ne se réfèrent pas au cas du pêcheur disparu que j'ai mentionné ci-dessus, mais sont un exemple de jouet tiré de cette présentation
Carte de probabilité 1 (le rouge indique la probabilité la plus élevée, le bleu la plus faible)
Notez le cercle qui est l'emplacement de départ.
Carte de probabilité 2 - Plus de temps s'est écoulé
Notez que la carte de probabilité est devenue multimodale. En effet, dans cet exemple, plusieurs scénarios sont pris en compte:
- La personne flotte dans l'eau - mode moyen supérieur
- La personne est dans un radeau de sauvetage (plus affectée par le vent du Nord) - 2 derniers modes (séparés à cause des "effets de foc")
Carte de probabilité 3 - La recherche a été effectuée le long des chemins rectangulaires en rouge Cette image montre les chemins optimaux produits par le planificateur (un autre composant de SAROPS). Comme vous pouvez le voir, ces chemins ont été recherchés et la carte de probabilité a été mise à jour par le simulateur.
Vous vous demandez peut-être pourquoi les zones qui ont été recherchées n'ont pas été réduites à une probabilité nulle. C'est parce qu'il y a une probabilité d'échec, , pris en compte, c'est-à-dire qu'il y a une chance non négligeable que le chercheur oublie la personne dans l'eau. Naturellement, la probabilité d'échec est beaucoup plus élevée pour une personne seule à flot que pour une personne dans un radeau de sauvetage (plus facile à voir), c'est pourquoi les probabilités dans la zone supérieure n'ont pas beaucoup baissé.
Effets d'une recherche infructueuse
C'est là que le théorème de Bayes entre en jeu. Une fois la recherche effectuée, la carte de probabilité est mise à jour en conséquence, de sorte qu'une autre recherche peut être planifiée de manière optimale.
Après avoir examiné le théorème de Bayes sur wikipedia et dans l'article Une explication intuitive (et courte) du théorème de Bayes sur BetterExplained.com
J'ai pris l'équation de Bayes:
Et défini A et X comme suit ...
Événement A: la personne se trouve dans cette zone (cellule de la grille)
Test X: recherche infructueuse sur cette zone (cellule de la grille), c.-à-d. Recherche dans cette zone et n'a rien vu
Céder,
J'ai trouvé dans Search and Rescue Optimal Planning System que SAROPS calcule la probabilité d'échec de la recherche,
Alors maintenant, nous avons,
L'équation de Bayes est-elle correctement appliquée ici?
Comment le dénominateur, la probabilité d'une recherche infructueuse, serait-il calculé?
Toujours dans Search and Rescue Optimal Planning System , ils disent
Les probabilités a priori sont "normalisées à la manière bayésienne habituelle" pour produire les probabilités postérieures
Que signifie «normalisé à la mode bayésienne normale» ?
Cela signifie-t-il que toutes les probabilités sont divisées par
Enfin, quelle serait la bonne façon de normaliser la carte de probabilité quadrillée après avoir mis à jour pour une recherche infructueuse, étant donné que puisque vous n'avez pas recherché TOUTES les zones (cellules de la grille), vous auriez des cellules égales à et certains égaux à P ( personne là-bas ∣
Encore une autre note de simplification - selon Search and Rescue Optimal Planning System, la distribution postérieure est en fait calculée en mettant à jour les probabilités des trajectoires de dérive simulées, puis EN recréant la carte de probabilité quadrillée. Afin de garder cet exemple assez simple, j'ai choisi d'ignorer les chemins de simulation et de me concentrer sur les cellules de la grille.
J'ai été pointé vers un livre qui a un chapitre entier dédié à ma question - Analyse des opérations navales - par un ancien professeur qui était pilote d'hélicoptère et qui a effectué des missions de recherche et de sauvetage, rien de moins!
Dans le chapitre 8, un exemple est fourni quelque chose comme ça (je l'ai personnalisé un peu):
Pour commencer, il y a une distribution préalable maillée pour l'emplacement de la ou des personnes disparues, du bateau, etc.
Distribution préalable:
Une recherche est effectuée sur une partie de la grille et les probabilités sont mises à jour avec une distribution postérieure normalisée en appliquant l'équation de Bayes de la même manière que je l'ai mentionné dans mes questions:
où (i, j) = (lat, long)
Dans ce cas, j'ai décidé de rechercher la colonne 3 parce que cette colonne avait la plus grande probabilité totale antérieure .
Distribution postérieure normalisée après recherche de la troisième colonne w / pFail = 0,2:
Ma question était principalement de savoir comment le postérieur était normalisé. Voici comment cela a été fait dans le livre - divisez simplement chaque probabilité postérieure individuelle par la somme totale , S :
J'ai choisi une probabilité de 0,2 d'échec de recherche parce que mon professeur avait ceci à dire: «Nous ne recherchons que 80% de probabilité de détection parce que c'est généralement le meilleur compromis entre timlieness et précision.
Juste pour les coups de pied, j'ai exécuté un autre exemple avec un pFail de 0,5. Alors que dans le premier exemple ( pFail = 0,2), le prochain meilleur itinéraire de recherche (étant donné les recherches postérieures normalisées et en supposant des recherches en ligne droite, pas de diagonale ou de zig-zag) serait de survoler la colonne 2, dans le deuxième exemple ( pFail = 0,5) le meilleur itinéraire suivant se trouve sur la ligne 2.
Distribution postérieure normalisée après recherche dans la troisième colonne w / pFail = 0,5:
Il a également ajouté ceci: "Les avions ont avec eux une petite liste de contrôle pour aider à déterminer la meilleure altitude et la meilleure vitesse. Travailler cela dans un hélicoptère volant, c'est comme s'asseoir au sommet d'une machine à laver, lire un livre collé sur une autre machine à laver."
la source