Comment interpréter une carte de contrôle contenant une majorité de valeurs nulles?

9

J'utilise un tableau de contrôle pour essayer de travailler sur certaines données d'infection et je déclencherai une alerte si l'infection est considérée comme "hors de contrôle".

Des problèmes surviennent lorsque j'arrive à un ensemble de données où la plupart des points de temps n'ont aucune infection, avec seulement quelques occasions d'une à deux infections, mais celles-ci dépassent déjà la limite de contrôle du graphique et déclenchent une alerte.

Comment dois-je travailler sur la carte de contrôle si l'ensemble de données présente très peu de comptes positifs d'infection?

Merci!

lokheart
la source

Réponses:

5

Modifiez la variable. Exécutez un graphique de contrôle pour la variable "temps entre les infections". De cette façon, au lieu d'une variable discrète avec une très petite plage de valeurs, vous avez une variable continue avec une plage de valeurs adéquate. Si l'intervalle entre les infections devient trop petit, le graphique donnera une indication "hors de contrôle".

Cette procédure a été recommandée par Donald Wheeler dans Understanding Variation: The Key to Managing Chaos .

Carlos Accioly
la source
cela semble intéressant, mais malheureusement, je ne trouve même pas une partie du livre de Google Books, je vais y jeter un coup d'œil, merci!
lokheart
En fait, vous n'avez pas besoin du livre pour cela (vous devriez certainement le lire, mais pas pour votre problème actuel). Tout ce que vous avez à faire est de tracer les intervalles de temps entre les infections et de créer votre tableau de contrôle en fonction de cette variable. Essayez-le, vous verrez que c'est assez simple.
Carlos Accioly
J'ai vu des suggestions similaires non seulement pour le temps entre les événements, mais aussi pour l'espace-temps entre les événements (ce qui est logique pour l'infection par la maladie). Voir le travail de Peter Rogerson pour quelques exemples ( Rogerson & Sun, 2001 ).
Andy W
2

Vous posez une question assez délicate!

Cela ne fait pas partie de mon domaine d'expertise, mais je sais que le professeur Farrington travaille sur ce problème. Je regarderais donc certains de ses articles et suivrais quelques-unes de ses références. Pour vous aider à démarrer, ce rapport semble pertinent.

csgillespie
la source
1

Serait-il logique de tracer le graphique de contrôle en fonction d'une moyenne des infections hebdomadaires ou d'une autre moyenne flottante similaire? Cela pourrait-il alors "amortir" les pointes dues aux valeurs élevées quotidiennes tout en garantissant que les changements de tendance sont détectés de manière relativement rapide.

Ian Turner
la source
1

Vous pouvez peut-être créer un cas de pointe dans votre routine / logiciel pour faire face à la situation. Si vous détectez plusieurs zéros dans l'ensemble de données, vous définissez un contrôle distinct pour cette situation particulière. Il s'agit évidemment d'un hack et non d'une solution fondée sur des principes, mais peut répondre à vos besoins actuels jusqu'à ce que vous puissiez trouver quelque chose de mieux.


la source
Je suis d'accord que c'est la méthode la plus simple et fera probablement le travail. Je pense que je suggérerais simplement un niveau minimum pour la ligne C. Si un ou deux cas déclenchent trop de fausses alertes positives, modifiez simplement le seuil à quelque chose de plus élevé.
Andy W
1

Thomas Ryan ("Méthodes statistiques pour l'amélioration de la qualité", Wiley, 1989) décrit plusieurs procédures. Il a tendance à essayer de réduire tous les graphiques de contrôle au cas normal, donc ses procédures ne sont pas aussi créatives qu'elles pourraient l'être, mais il prétend qu'elles fonctionnent plutôt bien. L'une consiste à traiter les valeurs comme des données binomiales et à utiliser la transformation ArcSin, puis à exécuter des graphiques CUSUM standard. Une autre consiste à afficher les valeurs en tant que données de Poisson et à utiliser la transformation racine carrée, puis à nouveau exécuter un graphique CUSUM. Pour ces approches, qui sont destinées au contrôle qualité des processus, vous êtes censé connaître le nombre d'individus potentiellement exposés au cours de chaque période. Si vous ne le faites pas, vous devrez probablement utiliser le modèle de Poisson. Étant donné que les infections sont rares,

Cependant, on se demande si les graphiques de contrôle sont le modèle conceptuel correct pour votre problème. Vous ne menez pas vraiment de processus de contrôle de la qualité ici: vous savez probablement, pour des raisons scientifiques, quand le taux d'infection est alarmant. Vous savez peut-être, à titre d'exemple hypothétique, que moins de dix infections sur une période d'une semaine sont rarement le signe avant-coureur d'une épidémie. Pourquoi ne pas fixer votre limite supérieure sur ce type de base plutôt que d'employer une limite statistique presque inutile?

whuber
la source
Idem avec votre deuxième paragraphe. Si vous savez que 2 infections sont trop faibles pour être gênées, vous pouvez probablement raisonnablement former une estimation minimale dans laquelle vous souhaitez qu'une alerte soit déclenchée.
Andy W