Comment choisir de quitter la file d'attente de bus ou d'y rester en utilisant la théorie des probabilités?

11

Je pense à quelque chose depuis un certain temps maintenant, et comme je ne suis pas très compétent en théorie des probabilités, je pensais que cela pourrait être un bon endroit pour poser cette question. C'est quelque chose qui m'est venu dans les longues files d'attente des transports publics.

Supposons que vous vous trouviez dans une gare routière et que vous savez qu'un bus (ou plusieurs bus) viendra certainement à l'avenir (pendant la journée), mais vous ne connaissez pas le moment exact. Vous imaginez une probabilité que le bus arrive dans les cinq minutes. Vous attendez donc cinq minutes. Mais le bus n'arrive pas. La probabilité est-elle maintenant inférieure ou supérieure à celle que vous aviez imaginée à l'origine?

La question est parce que si vous utilisez le passé pour prédire l'avenir, vous ne serez peut-être pas très optimiste quant à l'arrivée du bus. Mais vous pourriez peut-être aussi penser que cela rend l'événement plus probable: le bus n'étant pas encore arrivé, il y a moins de minutes disponibles dans la journée et donc la probabilité est plus élevée.

Pensez aux cinq dernières minutes de la journée. Vous avez été là toute la journée et aucun bus n'est venu. Donc, à en juger uniquement par le passé, vous ne pouvez pas prédire que le bus va arriver dans les cinq prochaines minutes. Mais comme vous êtes sûr qu'un bus arrivera avant la fin de la journée et qu'il ne reste que cinq minutes pour terminer la journée, vous pouvez être sûr à 100% que le bus arrivera dans les cinq minutes.

Donc, la question est, si je vais calculer la probabilité et abandonner la file d'attente, quelle méthode dois-je utiliser? C'est parce que parfois j'arrête et soudain le bus arrive, mais parfois j'attends et j'attends et le bus ne vient pas. Ou peut-être que toute cette question est absurde et que c'est tout simplement terriblement aléatoire?

numéro cinq
la source

Réponses:

1

Je pense que vous avez répondu à votre propre question. Supposons que vous êtes sûr que n bus arriveront à la fin de la journée (qui est à h heures) mais que vous ne savez pas quand, dans ces h heures, ils arriveront, vous pouvez utiliser une distribution de poisson avec un taux égal à n / h et calculer la probabilité qu'un seul bus arrive dans les dix prochaines minutes, par exemple. Pendant que vous attendez le bus et que h commence à diminuer, le taux n / h commence à augmenter et les chances qu'un bus arrive dans les dix prochaines minutes augmentent. Donc, à chaque instant qui passe, il est de moins en moins logique que vous quittiez la file d'attente (en supposant que le bus aura de la place pour vous à son arrivée).

user3353185
la source
Belle réponse, merci beaucoup. J'avais la même intuition, mais je ne savais pas que cela s'appelait une distribution de Poisson.
numberfive
2
Si vous modélisez vraiment les arrivées de bus comme un processus de Poisson, ce n'est précisément pas vrai. Les processus de Poisson sont "sans mémoire", car ils modélisent l'événement d'une arrivée de bus à tout moment comme une probabilité constante dans le temps. C'est-à-dire après avoir attendu 5 minutes sans arrivée de bus, le modèle prédira la même probabilité pour un bus arrivant dans les 10 minutes suivantes que dans les 10 minutes d'origine.
leekaiinthesky
leekaiinthesky, vous avez raison de dire que pour un taux donné, poisson est une distribution sans mémoire. Cependant, si nous sommes sûrs que n bus arriveront à la fin de la journée, le taux lui-même augmente continuellement.
user3353185
Même sous ces hypothèses spécifiques, l'utilisation de la distribution de Poisson ne donne pas la bonne réponse. Votre argument est basé sur l'augmentation du taux car vous savez que n bus arriveront au total, mais dans la distribution de Poisson le nombre total d'événements n'est pas fixe. Même dans les 10 minutes pour lesquelles vous souhaitez calculer la probabilité, le taux changerait déjà en fonction de votre argument. Ce n'est qu'une approximation - ce serait toujours une bonne réponse si vous discutez de la qualité de l'approximation.
Erik
3

Cela dépend de la proximité de l'horaire de vos bus.

  1. S'ils ont un horaire régulier, chaque minute que vous attendez est une minute plus proche de l'arrivée d'un bus, et en moyenne, vous attendez la moitié de l'intervalle entre les bus.

  2. Si les bus devaient arriver à des heures inter-bus variables, à un certain taux horaire moyen, vous êtes plus susceptible d'arriver à l'arrêt de bus dans un long intervalle que dans un court. En effet, s'ils arrivent "effectivement au hasard" (selon un processus de Poisson) peu importe le temps que vous attendez, votre attente restante est la même.

  3. Si les choses empirent (gappier / bursty que les arrivées "aléatoires", peut-être à cause de problèmes de circulation) alors il vaut mieux ne pas attendre.

Glen_b -Reinstate Monica
la source
D'accord, je vais essayer de digérer cela. Merci. Donc, si nous ne connaissons pas le taux horaire moyen, nous ne pouvons fondamentalement rien dire?
numberfive
2
Si vous attendez 23 heures et que le bus n'est toujours pas venu, veuillez ignorer la prémisse des distributions (cdf) totalisant toujours jusqu'à 1. Le bus ne viendra tout simplement pas. En général, les Européens croient en une distribution uniforme, un bon pari si vous êtes japonais; pour les Américains, les transports publics sont davantage considérés avec l'œil jaunâtre d'un poisson, un processus sans mémoire, et ils conduisent leurs propres voitures ... Pensez-y ... Peu importe combien de temps vous avez attendu la probabilité que le bus arrive à un un certain temps reste obstinément le même. J'ai entendu dire que la distribution Weibull peut aider, mais je n'en suis pas sûr.
Antoni Parellada
1
Voici un excellent article gratuit sur le Weibull et ce sujet.
Antoni Parellada
@Antoni Merci. Il existe une mesure dans laquelle les modèles de probabilité (comme le Poisson dans le point 2 de ma réponse) ne fonctionnent pas vraiment pour ce problème; les arrivées de bus ne sont pas vraiment un processus aléatoire de la manière décrite ci-dessus. Si vous les poussez assez fort, bien sûr, les conclusions auxquelles ils aboutiraient n'auraient aucun sens.
Glen_b -Reinstate Monica
@AntoniParellada et Glen_b merci beaucoup pour vos réponses. Je n'avais pas imaginé que tant de choses se cachaient derrière cette question. Je vais continuer à étudier pour comprendre tout ce que vous avez gentiment écrit. Passez une excellente journée.
numberfive
1

bonne question!

Du point de vue des probabilités, l'attente peut certainement augmenter les chances. Ce sera le cas des distributions gaussiennes et uniformes. Ce ne serait cependant pas le cas pour les distributions exponentielles - ce qui est bien avec les distributions exponentielles étant "sans mémoire" dans ce sens, car la probabilité pour l'intervalle suivant est toujours la même.

Cependant, je pense qu'une chose plus intéressante pourrait être de générer une fonction de coût. Quel est le coût du transport alternatif (taxi, ueber)? Quel est le coût d'un retard? Ensuite, vous pouvez dépoussiérer le livre de calculs et minimiser la fonction de coût.

Pour me convaincre que les chances augmentent toujours pour les distributions gaussiennes, j'ai écrit un peu de matlab, mais je vais essayer de trouver quelque chose de plus mathématiquement pur. Je pense que pour l'uniforme, c'est évident, car le numérateur est constant (jusqu'à rien) et le dénominateur diminue toujours vers rien.

MikeP
la source
2
Une hypothèse de l'OP est que "vous êtes sûr qu'un bus arrivera avant la fin de la journée", ce qui impose des restrictions intéressantes sur la distribution de probabilité. J'aimerais avoir une telle certitude dans la vraie vie.
EdM
@MikeP Merci pour votre réponse. Cela s'applique-t-il même lorsque la distribution sous-jacente est inconnue? Ou peut-être que je peux assumer une certaine distribution? Cela étant, il se pourrait qu'au fil du temps, je puisse changer d'avis et dire qu'une telle distribution ne tient plus et en chercher une autre. La distribution sans mémoire semble agréable, mais peut-être que ce que j'aimerais savoir nécessite une distribution qui tient compte du passé.
numberfive
2
Pas de problème @NormanSimon! Pas toujours. Par exemple, supposons que vous ayez un pdf trimodal, j'ai fait un exemple rapide avec la somme de 3 gaussiens (chacun avec sigma de 3, avec des moyennes de -8, 0 et +8. Dans ce cas, lorsque vous êtes tombé sur un bosse, les chances ont en fait légèrement baissé pour les trois prochaines minutes
MikeP
Oh, chéri, Mike, ça semble si compliqué! Mais je promets de continuer à étudier. Peut-être que je pose des questions trop avancées alors que je suis encore débutant. Mais beaucoup, merci beaucoup =)
numberfive
1

Si vous supprimez la restriction selon laquelle le bus doit arriver à un moment donné de la journée, on peut affirmer que plus vous attendez, plus vous vous attendez à devoir encore attendre. La raison? Plus vous attendez, plus vous croyez que le paramètre du taux de Poisson est petit. Voir la question 1, ici .

Créosote
la source
Vous êtes les bienvenus. Mais je voulais dire "le paramètre de débit est grand ", pas petit ...! J'ai modifié ma réponse en conséquence.
Creosote