Test d'hypothèse de Poisson pour deux paramètres

9

Donc, pour le plaisir, je prends certaines données d'appels du centre d'appels où je travaille et j'essaie de faire des tests d'hypothèse sur eux, en particulier le nombre d'appels reçus en une semaine, et j'utilise une distribution de Poisson pour l'adapter. En raison de l'objet de mon travail, il existe deux types de semaines, appelons l'une d'entre elles les semaines où je suppose qu'il y a plus d'appels et les semaines hors semaine où je suppose qu'il y en a moins.

J'ai une théorie selon laquelle le des semaines (appelons-le ) est plus grand que celui des semaines hors (appelons-le ) $\lambda$ $\lambda_1$ $\lambda_2$

L'hypothèse que je veux tester est donc $H_0: \lambda_1 > \lambda_2, H_1: \lambda_1 \leq \lambda_2$

Je sais comment tester un paramètre (disons ) mais je ne sais pas trop comment faire 2 étant donné un ensemble de données. Supposons que je prenne deux semaines de données pour chacune et pour la semaine et et pour la semaine. Quelqu'un peut-il m'aider à utiliser cette version plus simple pour que je puisse l'appliquer à un ensemble de données plus grand? Toute aide est appréciée, merci. $H_0: \lambda_1 > 1, H_1: \lambda_1 \leq 1$ $X_1 = 2$ $X_2 = 3$ $Y_1 = 2$ $Y_2=6$

hypothesis-testing poisson-distribution James Snyder
la source

3

Les appels sont-ils vraiment distribués? S'il y a beaucoup d'appels, il est préférable de les modéliser comme à peu près normaux. Mais cela peut tuer le plaisir.

RegressForward

1

Eh bien, qu'est-ce qui détermine que c'est comme ça que vous le cadrez bien? Je reçois x nombre d'appels discrets dans un délai unitaire. Je pourrais le faire comme une distribution normale, bien sûr, mais il veut dire que j'aimerais l'essayer avec Poisson car il convient.

James Snyder

Si vous supposez que les nombres sont de Poisson, vous pouvez simplement ajouter les nombres (corrigez-moi si je me trompe). Autrement dit, vous obtiendrez X = 2 + 3 et Y = 2 + 6. Vous pouvez ensuite tester une différence en utilisant, par exemple, le «poisson.test» en R. Si vous voulez vous lancer dans une analyse bayésienne, j'ai également un blog à ce sujet ici: sumsar.net/blog/2014/ 09 / Bayesian-first-aid-poisson-test

Rasmus Bååth

4

Notez que normalement l'égalité va dans le null (avec raison).

Cette question mise à part, je mentionnerai quelques approches pour tester ce type d'hypothèse

Un test très simple: condition sur le nombre total observé , qui le convertit en un test binomial de proportions. Imaginez qu'il y ait semaines et semaines hors semaines et semaines combinées. $n$ $w_\text{on}$ $w_\text{off}$ $w$

Puis sous le nul, les proportions attendues sont et $\frac{w_\text{on}}{w}$ respectivement. Vous pouvez faire un test unilatéral de la proportion dans les semaines en toute simplicité. $\frac{w_\text{off}}{w}$

Vous pouvez construire un test unilatéral en adaptant une statistique liée à un test de rapport de vraisemblance; la forme z du test de Wald ou un test de score peut être effectué unilatéralement par exemple et devrait bien fonctionner pour une plus grande . $\lambda$

Il existe d'autres points de vue.

Glen_b -Reinstate Monica
la source

1

Qu'en est-il de l'utilisation du GLM avec une structure d'erreur de Poisson et un lien de connexion ??? Mais l'idée du binôme peut être plus puissante.

Ivan Kshnyasev
la source

À l'heure actuelle, il s'agit davantage d'un commentaire que d'une réponse. Le vouliez-vous comme un commentaire, une question de clarification ou une réponse? Si ce dernier, pouvez-vous l'étendre en plus de réponse? Nous pouvons également le convertir en commentaire pour vous.

gung - Rétablir Monica

1

Je le réglerais avec un GLM Poisson ou Quasi-Poisson avec une préférence pour le binôme quasi-Poisson ou négatif.

Le problème avec l'utilisation du Poisson traditionnel est qu'il nécessite que la variance et la moyenne soient égales, ce qui n'est probablement pas le cas. Le quasi-Poisson ou NB estime la variance sans restriction par la moyenne.

Vous pouvez faire tout cela en R très facilement.

# week on = 1, week off = 0
week.status <- c(1, 1, 0, 0)
calls <- c(2, 6, 2, 3)
model <- glm(calls ~ week.status, family = poisson())
# or change the poisson() after family to quasipoisson() 
# or use the neg binomial glm from the MASS package

L'approche GLM est bénéfique et comme vous pouvez l'étendre pour inclure des variables supplémentaires (par exemple, le mois de l'année) qui pourraient affecter le volume des appels.

Pour le faire à la main, j'utiliserais probablement une approximation normale et un test t à deux échantillons.

iacobus
la source

1

Nous commençons par l'estimation du maximum de vraisemblance pour le paramètre de Poisson, qui est la moyenne.

$\hat\lambda_1=\bar Y~~and~~\hat\lambda_2=\bar X$

$\bar Y-\bar X\sim N(\lambda_1-\lambda_2,\frac{\lambda_1}{n_1}+\frac{\lambda_2}{n_2})$

$\frac{(\bar Y-\bar X)-\lambda_1-\lambda_2}{\sqrt{\frac{\lambda_1}{n_1}+\frac{\lambda_2}{n_2}}}$

$Z<Critical~Value$

Hemant Rupani
la source

0

À partir de la page 125 de l'hypothèse statistique de test de Casella, la réponse au type de question que vous avez formulée est décrite. J'ai joint un lien vers un pdf que j'ai trouvé en ligne pour votre référence. Casella's Testing Statistical Hypothesis, troisième édition .

Nuzhi Meyen
la source

Joli pointeur, cependant les réponses en lien uniquement sont déconseillées sur la validation croisée. Pourriez-vous esquisser la résolution dans votre réponse? Je vous remercie.

Xi'an

Désolé, je n'étais pas au courant de cette règle. Merci de me l'avoir fait savoir. :) J'essaierai de donner une réponse complète dès que possible.

Nuzhi Meyen

Test d'hypothèse de Poisson pour deux paramètres

Réponses: