Je cherche de bons exemples de situations qui ne conviennent pas au modèle avec une distribution de Poisson, pour m'aider à expliquer la distribution de Poisson aux étudiants.
On utilise couramment le nombre de clients arrivant dans un magasin dans un intervalle de temps comme exemple qui peut être modélisé par une distribution de Poisson. Je cherche un contre-exemple dans la même veine, c'est-à-dire une situation qui peut être considérée comme un processus de comptage positif en temps continu qui n'est clairement pas Poisson.
La situation devrait idéalement être aussi simple et directe que possible, afin de faciliter la compréhension et la mémorisation des élèves.
Réponses:
Nombre de cigarettes fumées dans une période de temps: cela nécessite un processus de gonflage nul (par exemple Poisson gonflé zéro ou binôme négatif gonflé zéro) car tout le monde ne fume pas.
la source
Voulez-vous dire des données de comptage positives? Sans bornes?
Le binôme négatif est populaire.
Un autre bon modèle est le Poisson avec 0 gonflé. Ce modèle suppose que quelque chose se passe ou non - et si c'est le cas, il suit un Poisson. J'ai vu un exemple récemment. On a demandé aux infirmières qui traitaient des patients atteints du SIDA à quelle fréquence ils avaient des comportements de stigmatisation des autres en raison de leur implication avec des patients atteints du SIDA. Un grand nombre d'entre eux n'avaient jamais vécu de telles expériences, peut-être à cause de leur lieu de travail ou de leur résidence. Parmi ceux qui l'ont fait, le nombre d'expériences stigmatisantes variait. Il y avait plus de 0 rapportés que ce à quoi vous vous attendez d'un Poisson droit, essentiellement parce qu'une certaine proportion du groupe à l'étude n'était tout simplement pas dans un environnement qui les exposait à de tels comportements.
Un mélange de Poisson vous donnerait également un processus ponctuel.
la source
Compter des processus qui ne sont pas des poissons? Eh bien, tout processus d'espace d'échantillon fini comme l'uniforme binomial ou discret. Vous obtenez un processus de comptage de Poisson en comptant des événements ayant des temps interarrivaux indépendants qui sont distribués de façon exponentielle, de sorte qu'une multitude de généralisations en découlent, comme avoir des temps interarrivaux distribués gamma ou lognormal ou Weibull, ou tout type de temps interarrival abstrait non paramétrique Distribution.
la source
On ne sait pas si vous voulez ou non compter les processus.
Si j'interprète la balise `` enseignement '' comme signifiant que vous enseignez le processus de Poisson, alors, pour enseigner un processus en général, le processus de Bernoulli est un processus aléatoire facile à expliquer et à visualiser et est lié au processus de Poisson. Le processus de Bernoulli est l'analogue discret, il pourrait donc être un concept compagnon utile. C'est juste qu'au lieu d'un temps continu, nous avons des intervalles de temps discrets.
Un exemple pourrait être un vendeur de porte à porte où nous comptons les succès des maisons qui font un achat.
distribution binomiale B (n, p) au lieu d'un Poisson
C'est l'approche que Bertsekas et Tsitsiklis utilisent dans Introduction To Probability , 2e éd., Introduisant le processus de Bernoulli avant le processus de Poisson. Dans leur manuel, il y a plus d'extensions au processus de Bernoulli qui sont applicables au processus de Poisson telles que les fusionner ou les partitionner, ainsi que des ensembles de problèmes avec des solutions.
Si vous cherchez des exemples de processus aléatoires et que vous voulez simplement jeter les noms, il y en a plusieurs.
Le processus gaussien est important dans les applications. Le processus de Weiner en particulier, qui est un type de processus gaussien, est également appelé mouvement brownien standard et a des applications en finance et en physique.
la source
En tant qu'actuaire IARD, je m'occupe d'exemples concrets de processus discrets qui ne sont pas toujours des poissons. Pour les secteurs d'activité de haute sévérité et de basse fréquence, la distribution de Poisson est mal adaptée car elle exige un rapport variance / moyenne de 1. La distribution binomiale négative, mentionnée ci-dessus, est beaucoup plus couramment utilisée, et les distributions de Delaporte est utilisé dans certains ouvrages, mais moins souvent dans la pratique actuarielle nord-américaine standard.
Pourquoi en est-il ainsi est une question plus profonde. Le binôme négatif est-il tellement meilleur car il représente un processus de Poisson dont le paramètre moyen est lui-même distribué gamma? Ou est-ce parce que les occurrences de perte manquent d'indépendance (comme le font les tremblements de terre selon la théorie actuelle, que plus on attend que la terre glisse, plus elle est due à l'augmentation de la pression), est-elle non stationnaire (les intervalles ne peut pas être subdivisé en séquences, dont chacune est stationnaire, ce qui permettrait l'utilisation d'un Poisson non homogène), et certains secteurs d'activité permettent certainement des occurrences simultanées (par exemple, faute professionnelle médicale avec plusieurs médecins couverts par la police).
la source
D'autres ont mentionné plusieurs exemples de processus ponctuels qui ne sont pas de Poisson. Étant donné que le Poisson correspond aux temps interarrivaux exponentiels si vous choisissez une distribution temporelle interarrivale qui n'est pas exponentielle, le processus ponctuel résultant n'est pas Poisson. AdamO a souligné le Weibull. Vous pouvez utiliser gamma, lognormal ou beta comme choix possibles.
Le Poisson a la propriété que sa moyenne est égale à sa variance. Un processus ponctuel dont la variance est supérieure à la moyenne est parfois appelé sur-dispersé et si la moyenne est supérieure à la variance, il est sous-dispersé. Ces termes sont utilisés pour relier le processus à un Poisson. Le binôme négatif est souvent utilisé car il peut être sur-dispersé ou sous-dispersé en fonction de ses paramètres.
Le Poisson a une variance constante. Un processus ponctuel qui correspond aux conditions de Poisson, sauf qu'il n'a pas de paramètre de taux constant et par conséquent une moyenne et une variance variant dans le temps, est appelé Poisson inhomogène.
Un processus avec des temps interarrivaux exponentiels mais pouvant avoir plusieurs événements à l'heure d'arrivée est appelé Poisson composé. Bien que similaires au processus de Poisson et ayant un nom contenant le mot Poisson, les processus de Poisson inhomogènes et composés sont différents d'un processus ponctuel de Poisson.
la source
Un autre exemple intéressant de processus de comptage sans Poisson est représenté par la distribution de Poisson tronquée à zéro (ZTPD). Le ZTPD peut ajuster des données concernant le nombre de langues que les sujets peuvent parler dans des conditions physiologiques. Dans ce cas, la distribution de Poisson se comporte mal, car le nombre de langues parlées est par définition> = 1: donc 0 est exclu a priori.
la source
Je pense que vous pouvez prendre votre processus de Poisson d'arrivée des clients et le modifier de deux manières différentes: 1) les arrivées de clients sont mesurées 24 heures par jour, mais le magasin n'est pas réellement ouvert toute la journée, et 2) imaginez deux magasins concurrents avec Poisson traite les heures d'arrivée des clients et examine la différence entre les arrivées dans les deux magasins. (L'exemple n ° 2 provient de ma compréhension du Springer Handbook of Engineering Statistics, partie A, propriété 1.4.)
la source
Vous voudrez peut-être reconsidérer l'exemple du football. Il semble que les taux de score des deux équipes augmentent au fur et à mesure du match, et qu'ils changent lorsque les équipes modifient leurs priorités d'attaque / défense en fonction du score actuel.
Ou plutôt, utilisez-le comme un exemple de la façon dont les modèles simples peuvent fonctionner étonnamment bien, stimulant l'intérêt pour l'investigation statistique de certains phénomènes, et fournissant une référence pour de futures études qui collectent plus de données pour enquêter sur les écarts et proposer des élaborations.
Dixon & Robinson (1998), "Un modèle de processus de naissance pour les matchs de football d'association", The Statistician , 47 , 3.
la source
Étant donné que la question est liée à la compréhension de la distribution de Poisson, je vais essayer, car j'ai récemment examiné cela quelque peu pour les modèles d'appels entrants du centre d'appels (qui suivent une distribution exponentielle sans mémoire au fil du temps).
Je pense que plonger dans un autre modèle tangentiel qui nécessite essentiellement la connaissance de Poisson pour comprendre comment ce n'est pas le cas peut être quelque peu déroutant, mais c'est juste moi.
Je pense que le problème avec la compréhension de Poisson est l'axe temporel continu sur lequel il se trouve --- à chaque seconde, l'événement ne risque plus de se produire --- mais plus vous allez loin dans le futur, plus il est certain événement.
Vraiment, je pense que cela simplifie la compréhension si vous échangez simplement l'axe «temps» contre des «essais» ou des «événements».
Quelqu'un peut me corriger si c'est loin de la base, car je pense que c'est une explication facile, mais je pense que vous pouvez remplacer le lancer d'une pièce, ou le lancer d'un dé, par `` le temps jusqu'à ce qu'un appel téléphonique arrive '' (ce que je généralement utilisé pour Erlang C / personnel du centre d'appels).
Au lieu de "temps jusqu'à ce qu'un appel téléphonique arrive" ---- vous pouvez le remplacer par ... "lance jusqu'à ce qu'un dé atteigne six".
Cela suit la même logique générale. La probabilité (comme tout jeu) est complètement indépendante à chaque lancer (ou minute) et est sans mémoire. Cependant, la probabilité de «non 6» diminue toujours plus lentement mais sûrement vers 0 à mesure que vous augmentez le nombre d'essais. C'est plus facile si vous voyez les deux graphiques (probabilité d'appel avec le temps, vs probabilité de six avec des rouleaux).
Je ne sais pas si cela a du sens - c'est ce qui m'a aidé à le mettre en termes concrets. Maintenant, la distribution de poisson est un décompte plutôt qu'un «temps entre les appels» ou des «essais jusqu'à ce que le résultat soit six» - mais elle repose sur cette probabilité.
la source
Nombre de visites d'un client individuel à l'épicerie dans un intervalle de temps donné.
Après avoir été à l'épicerie, il est peu probable que vous reveniez pendant un certain temps, sauf si vous avez fait une erreur de planification.
Je pense que la distribution binomiale négative pourrait être utilisée ici, mais elle est discrète, alors que les visites se font en temps continu.
la source