Donc, pour le plaisir, je prends certaines données d'appels du centre d'appels où je travaille et j'essaie de faire des tests d'hypothèse sur eux, en particulier le nombre d'appels reçus en une semaine, et j'utilise une distribution de Poisson pour l'adapter. En raison de l'objet de mon travail, il existe deux types de semaines, appelons l'une d'entre elles les semaines où je suppose qu'il y a plus d'appels et les semaines hors semaine où je suppose qu'il y en a moins.
J'ai une théorie selon laquelle le des semaines (appelons-le ) est plus grand que celui des semaines hors (appelons-le )λ 1 λ 2
L'hypothèse que je veux tester est donc
Je sais comment tester un paramètre (disons ) mais je ne sais pas trop comment faire 2 étant donné un ensemble de données. Supposons que je prenne deux semaines de données pour chacune et pour la semaine et et pour la semaine. Quelqu'un peut-il m'aider à utiliser cette version plus simple pour que je puisse l'appliquer à un ensemble de données plus grand? Toute aide est appréciée, merci.X 1 = 2 X 2 = 3 Y 1 = 2 Y 2 = 6
la source
Réponses:
Notez que normalement l'égalité va dans le null (avec raison).
Cette question mise à part, je mentionnerai quelques approches pour tester ce type d'hypothèse
Puis sous le nul, les proportions attendues sont etwoffwsurw respectivement. Vous pouvez faire un test unilatéral de la proportion dans les semaines en toute simplicité.wdew
Il existe d'autres points de vue.
la source
Qu'en est-il de l'utilisation du GLM avec une structure d'erreur de Poisson et un lien de connexion ??? Mais l'idée du binôme peut être plus puissante.
la source
Je le réglerais avec un GLM Poisson ou Quasi-Poisson avec une préférence pour le binôme quasi-Poisson ou négatif.
Le problème avec l'utilisation du Poisson traditionnel est qu'il nécessite que la variance et la moyenne soient égales, ce qui n'est probablement pas le cas. Le quasi-Poisson ou NB estime la variance sans restriction par la moyenne.
Vous pouvez faire tout cela en R très facilement.
L'approche GLM est bénéfique et comme vous pouvez l'étendre pour inclure des variables supplémentaires (par exemple, le mois de l'année) qui pourraient affecter le volume des appels.
Pour le faire à la main, j'utiliserais probablement une approximation normale et un test t à deux échantillons.
la source
Nous commençons par l'estimation du maximum de vraisemblance pour le paramètre de Poisson, qui est la moyenne.
la source
À partir de la page 125 de l'hypothèse statistique de test de Casella, la réponse au type de question que vous avez formulée est décrite. J'ai joint un lien vers un pdf que j'ai trouvé en ligne pour votre référence. Casella's Testing Statistical Hypothesis, troisième édition .
la source