Comparaison des taux d'incidence

9

Je veux comparer les taux d'incidence entre deux groupes (un sans maladie et un avec).

Je prévoyais de calculer le taux d'incidence (IRR), c'est-à-dire le groupe de taux d'incidence B / groupe de taux d'incidence A, puis de tester si ce taux est égal à 1, et enfin de calculer des intervalles IC à 95% pour l'IRR.

J'ai trouvé une méthode de calcul de l'IC à 95% dans un livre (Rosner's Fundamentals of Biostatistics ):

exp[log(IRR)±1.96(1/a1)+(1/a2)]

et un 2 sont le nombre d'événements. Mais cette approximation n'est valable que pour des échantillons suffisamment grands et je pense que le nombre d'événements que j'ai est trop petit (peut-être pour la comparaison totale, c'est correct.)a1a2

Je pense donc que je devrais utiliser une autre méthode.

Im utilisant R et le paquet exactci et a constaté que je pourrais peut-être utiliser poisson.test(). Mais cette fonction a 3 méthodes pour définir les valeurs p bilatérales: centrale, minlike et blaker.

Donc , mes questions sont les suivantes :

  1. Est-il exact de comparer deux ratios de taux d'incidence im en utilisant un test de comparaison des taux de poisson?

  2. Lorsque vous utilisez la fonction poisson.test dans R du package exactci, quelle méthode est la meilleure?

La vignette pour exactci dit:

central: est 2 fois le minimum des valeurs p unilatérales délimitées ci-dessus par 1. Le nom «central» est motivé par les intervalles de confiance d'inversion associés qui sont des intervalles centraux, c'est-à-dire qu'ils garantissent que le vrai paramètre a moins de Probabilité d'être inférieure (supérieure) à la queue inférieure (supérieure) de l' intervalle de confiance de 100 (1- α )%. C'est ce qu'on appelle le TST (deux fois la méthode de la queue la plus petite) par Hirji (2006).α/2α

minlike: est la somme des probabilités de résultats avec des probabilités inférieures ou égales à la vraisemblance observée. Ceci est appelé la méthode PB (basée sur la probabilité) par Hirji (2006).

blaker: combine la probabilité de la plus petite queue observée avec la plus petite probabilité de la queue opposée qui ne dépasse pas cette probabilité de queue observée. Le nom «blaker» est motivé par Blaker (2000) qui étudie de manière approfondie la méthode associée pour les intervalles de confiance. C'est ce que l'on appelle la méthode CT (queue combinée) par Hirji (2006).

Mes données sont:

Group A: 
Age group 1: 3 cases    in 10459 person yrs.   Incidence rate: 0.29 
Age group 2: 7 cases    in 2279 person yrs.    Incidence rate: 3.07
Age group 3: 4 cases    in 1990 person yrs.    Incidence rate: 2.01
Age group 4: 9 cases    in 1618 person yrs.    Incidence rate: 5.56
Age group 5: 11 cases   in 1357 person yrs.    Incidence rate: 8.11
Age group 6: 11 cases   in 1090 person yrs.    Incidence rate: 10.09
Age group 7: 9 cases    in 819 person yrs.     Incidence rate: 10.99
  Total:    54 cases in 19612 person yrs.      Incidence rate: 2.75

Group B: 
Age group 1: 3 cases    in 3088 person yrs.   Incidence rate: 0.97 
Age group 2: 1 cases    in 707 person yrs.    Incidence rate: 1.41
Age group 3: 2 cases    in 630 person yrs.    Incidence rate: 3.17
Age group 4: 6 cases    in 441 person yrs.    Incidence rate: 13.59
Age group 5: 10 cases   in 365 person yrs.    Incidence rate: 27.4
Age group 6: 6 cases   in 249 person yrs.    Incidence rate: 24.06
Age group 7: 0 cases    in 116 person yrs.     Incidence rate: 0
  Total:    28 cases in 5597 person yrs.      Incidence rate: 5.0
Edwin
la source

Réponses:

2

Quelques réflexions:

Premièrement, votre comparaison suggérée - le taux d'incidence entre A et B - n'est actuellement conditionnée à aucune covariable. Ce qui signifie que votre nombre d'événements est de 54 pour le groupe A et de 28 pour le groupe B. C'est plus que suffisant pour aller avec les méthodes habituelles d'intervalle de confiance basées sur un grand échantillon.

Deuxièmement, même si vous avez l'intention de vous ajuster à l'effet de l'âge, plutôt que de calculer le ratio pour chaque groupe, vous pourriez être mieux servi en utilisant une approche de régression. Généralement, si vous stratifiez par plusieurs niveaux d'une variable, cela devient plutôt lourd par rapport à une équation de régression, ce qui vous donnerait le rapport des taux de A et B tout en contrôlant l'âge. Je crois que les approches standard fonctionneront toujours pour la taille de votre échantillon, bien que si cela vous inquiète, vous pouvez utiliser quelque chose comme glmperm .

Fomite
la source
1

Le taux d'incidence de chaque groupe dans vos données n'est que la moyenne d'une somme de variables de Bernoulli indépendantes (0/1) - chaque patient a sa propre variable recevant une valeur de 0 ou 1, vous les additionnez et prenez la moyenne, qui est le taux d'incidence.

Si de gros échantillons (et votre échantillon est grand), la moyenne sera distribuée normalement, vous pouvez donc utiliser un simple test z pour tester si les deux taux sont différents ou non.

Dans R, jetez un œil à prop.test: http://stat.ethz.ch/R-manual/R-patched/library/stats/html/prop.test.html

Si vous souhaitez utiliser pleinement les données, essayez de voir si la distribution des taux d'incidence est différente entre les groupes A et B.Pour cela, un test d'indépendance pourrait faire l'affaire, comme un chi carré d'un G -test: http://udel.edu/~mcdonald/statchiind.html

Ron
la source
0

La seule façon de s'assurer que l'échantillon est suffisamment grand (ou comme le dirait Charlie Geyer - que vous êtes réellement en terre d'asymétrie ) est de faire beaucoup de simulation Monte-Carlo ou, comme EpiGard l'a suggéré, d'utiliser quelque chose comme glmperm.

Quant à la méthode qui est la meilleure dans exactci, il n'y a pas de meilleure ici - ou comme Fisher l'a utilisé pour le dire

Le mieux pour quoi?

Michael Fay apporte quelques éclaircissements ici

phaneron
la source