En raison de la factorielle dans une distribution de poisson, il devient peu pratique d'estimer les modèles de poisson (par exemple, en utilisant le maximum de vraisemblance) lorsque les observations sont grandes. Ainsi, par exemple, si j'essaie d'estimer un modèle pour expliquer le nombre de suicides dans une année donnée (seules les données annuelles sont disponibles), et dire, il y a des milliers de suicides chaque année, est-ce mal d'exprimer des suicides par centaines , de sorte que 2998 serait 29,98 ~ = 30? En d'autres termes, est-ce mal de changer l'unité de mesure pour rendre les données gérables?
n!
=Gamma(n+1)
pour n> = 0. Essayez donc de rechercher une fonction appeléeGamma
si vous avez besoin de calculer la factorielle (ou connectez Gamma si vous calculez la probabilité de log)J'ai bien peur que tu ne puisses pas faire ça. Comme le dit @Baltimark, avec un gros lambda, la distribution sera de forme plus normale (symétrique), et avec une réduction, elle ne sera plus une distrubution de poisson. Essayez le code suivant dans R:
Le résultat est ci-dessous:
Vous pouvez voir que le poisson à échelle réduite (ligne rouge) est complètement différent de la distribution de poisson.
la source
Vous pouvez simplement ignorer la «factorielle» lorsque vous utilisez le maximum de vraisemblance. Voici le raisonnement de votre exemple de suicides. Laisser:
λ: Soyez le nombre attendu de suicides par an
k i : Soyez le nombre de suicides dans l'année i.
Ensuite, vous maximiseriez la probabilité de journalisation comme suit:
LL = ∑ (k i log (λ) - λ - k i !)
Maximiser ce qui précède équivaut à maximiser ce qui suit comme k i ! est une constante:
LL ' = ∑ (k i log (λ) - λ)
Pourrait expliquer pourquoi le factoriel est un problème? Suis-je en train de manquer quelque chose?
la source