Test statistique pour comparer la précision de deux appareils

10

Je compare deux dispositifs de contrôle de la température conçus pour maintenir la température corporelle à exactement 37 degrés chez les patients anesthésiés. Les appareils ont été adaptés à 500 patients formant deux groupes. Groupe A (400 patients) - Dispositif 1, Groupe B (100 patients) - Dispositif 2. Chaque patient a vu sa température mesurée une fois toutes les heures pendant 36 heures, me donnant 18000 points de données dans deux groupes. Je dois déterminer quel appareil contrôle plus précisément la température corporelle des patients sur une période de 36 heures. J'ai construit des graphiques linéaires joignant les valeurs médianes à chaque point dans le temps avec des barres de quartile et visuellement il semble y avoir une différence. Comment dois-je analyser mes données pour prouver une différence statistique?

RikT
la source
Avez-vous partagé des patients entre des appareils? Si vous ne l'avez pas fait, il doit y avoir une hypothèse supplémentaire selon laquelle les patients de deux groupes sont similaires au sens large.
Aksakal
Et un modèle à effets mixtes? Les erreurs standard pour chaque niveau (groupe A / B), dans un sens, vous indiqueraient la précision des mesures. Vous pouvez prendre en compte les séries chronologiques et les patients.
Roman Luštrik

Réponses:

2

La première chose à laquelle vous devrez réfléchir est de savoir ce que signifie (quantitativement) avoir une "bonne précision" dans un tel appareil. Je dirais que, dans un contexte médical, l'objectif est d'éviter les écarts de température qui vont dans une plage dangereuse pour le patient, donc une "bonne précision" va probablement se traduire par éviter des températures dangereusement basses ou élevées. Cela signifie que vous allez rechercher une métrique qui pénalise fortement les écarts importants par rapport à votre température optimale de 37 C. De ce fait, une mesure basée sur les fluctuations des températures médianes sera une mauvaise mesure de précision, alors que les mesures qui mettent en évidence des écarts importants seront meilleures.o

Lorsque vous formulez ce type de mesure, vous adoptez implicitement une "fonction de pénalité" qui pénalise les températures qui s'écartent de la température souhaitée. Une option consisterait à mesurer la «précision» en diminuant la variance autour de la température souhaitée (en la traitant comme la moyenne fixe pour le calcul de la variance). La variance pénalise l'erreur quadratique, ce qui donne une pénalisation raisonnable pour les écarts élevés. Une autre option consisterait à pénaliser plus lourdement (par exemple, erreur cubique). Une autre option serait de simplement mesurer la durée pendant laquelle chaque appareil a le patient en dehors de la plage de température qui est médicalement sûre. Dans tous les cas, tout ce que vous choisissez doit refléter les dangers perçus de déviation de la température souhaitée.

Une fois que vous aurez déterminé ce qui constitue une métrique de «bonne précision», vous allez formuler une sorte de «test d'hétéroscédasticité», formulé dans le sens plus large permettant toute mesure de précision que vous utilisez. Je ne suis pas sûr d'être d'accord avec le commentaire de whuber concernant l'ajustement pour l'autocorrélation. Cela dépend vraiment de votre formulation de la perte - après tout, rester dans une plage de températures élevées pendant une période prolongée pourrait être exactement la chose la plus dangereuse, donc si vous vous ajustez pour tenir compte de l'auto-corrélation, vous pourriez finir jusqu'à ne pas pénaliser suffisamment les résultats très dangereux.

Ben - Réintègre Monica
la source
0

Il s'agit d'un test d'homoscédasticité. Et comme il s'agit d'une série chronologique, le choix approprié est le test de Breusch – Pagan , et non le test F. Ce test ne répond UNIQUEMENT qu'à la question de l'égalité de précision entre les deux appareils. Le niveau de précision est une autre façon de penser la variance.

[Modifier: changé le test pour le bon, compte tenu de la dépendance temporelle]

Gary Chung
la source
3
Cette approche est raisonnable. Mais pourquoi ne pas atteindre directement les deux objectifs, en comparant les dispersions autour de la température cible plutôt que les variances (qui ne mesurent que les dispersions autour des températures moyennes)? Un problème important à vérifier en premier concerne la corrélation en série: si elle est élevée, alors une correction doit être apportée (comme la réduction des degrés de liberté dans les tests). Un autre problème concerne la perte : la fonction de perte n'est probablement pas quadratique. Peut-être que les gens peuvent facilement tolérer de petites fluctuations, mais la survenance d'une grande fluctuation pourrait faire mal. Cela devrait être exploré.
whuber
@whuber En ce qui concerne la comparaison autour de la température cible, si c'était moi, c'est exactement ce que je ferais. Le PO vient juste de poser la question de la variance, donc quelles que soient nos inclinations, nous devons y répondre directement, oui? :)
Gary Chung
2
Le problème pour un test F ne sera pas la normalité, ce sera probablement l'indépendance. Ce sont des séries chronologiques.
Glen_b -Reinstate Monica
@Glen_b Je ne peux pas croire que j'ai raté ce point. Merci de le saisir. Édité.
Gary Chung
9
Avec égards, non: la différence entre ce site et, disons, le site Math, c'est qu'une partie substantielle de la réponse à une question statistique implique d'aider le PO à le cadrer comme il le souhaitait. Très souvent, les réponses correctes aux questions posées à l'origine ici sont loin d'être utiles, voire trompeuses. Ainsi, notre première tâche en tant que lecteurs actifs et candidats potentiels est de vérifier que nous interprétons la question de manière utile et appropriée et de fournir des réponses qui répondent le mieux aux objectifs du PO. Utilisez les commentaires de la question pour poser des questions de clarification et vérifier votre interprétation.
whuber
0

Si vous souhaitez savoir dans quelle mesure les appareils maintiennent une température de 37 ° C, vous pouvez:

  1. Utilisez toutes les données disponibles de chaque personne telles quelles ou
  2. Estimer l'écart moyen par personne par rapport au 37C en utilisant les 36 essais de chaque personne.

Les données se prêtent naturellement à un traitement à mesures répétées. En traitant les essais intra-personne comme des grappes, vous réduirez la probabilité d'un intervalle de confiance faussement estimé autour de l'effet du dispositif. En outre, vous pouvez tester l'effet du temps entre les deux appareils ou en tant qu'interaction avec l'appareil pour déterminer si le maintien de la température dans le temps était bon. Trouver un moyen de visualiser tout cela est d'une importance capitale et peut suggérer une approche plutôt qu'une autre. Quelque chose dans le sens de:

library(dplyr)
library(lme4)

set.seed(42)
id <- rep(1:500, each=36)
time <- rep(1:36,500)
temp <- c(rnorm(36*400, 38,0.5), rnorm(36*100,37.25,0.5))
temp <- temp + 1/time

prox_37 <- temp - 37
group <- c(rep("A",36*400), rep("B",36*100))
graph_t <- ifelse(group=="A", time-0.25, time+0.25)
df <- data.frame(id,time,temp,prox_37,group, graph_t)

id_means <- group_by(df, id) %>% summarize(mean_37 = mean(prox_37))
id_means$group <- c(rep("A",400), rep("B",100))

boxplot(id_means$mean_37 ~ id_means$group)

plot(graph_t, prox_37, col=as.factor(group))
loess_fit <- loess(prox_37 ~ time, data = df)
lines(c(1:36), predict(loess_fit, newdata= c(1:36)) , col = "blue")

summary(t.test(mean_37 ~group, data=id_means))

model1 <- glm(prox_37 ~ as.factor(group), family = "gaussian", data=df)
model2 <- lmer(prox_37 ~ as.factor(group) + (1 | id), data=df)
model3 <- lmer(prox_37 ~ as.factor(group) + time + (1 | id), data=df)
model4 <- lmer(prox_37 ~ as.factor(group) + time + time*as.factor(group) + (1 | id), data=df)

AIC(model1)
summary(model2)
summary(model3)
summary(model4)

entrez la description de l'image ici

Todd D
la source