Une analyse intermédiaire est une analyse des données à un ou plusieurs moments avant la clôture officielle de l'étude dans le but, par exemple, de mettre éventuellement fin à l'étude plus tôt.
Selon Piantadosi, S. ( Essais cliniques - une perspective méthodologique ): " L'estimation d'un effet du traitement sera biaisée lorsqu'un essai se terminera à un stade précoce. Plus la décision est précoce, plus le biais est important. "
Pouvez-vous m'expliquer cette affirmation. Je peux facilement comprendre que la précision va être affectée, mais l'affirmation concernant le biais n'est pas évidente pour moi ...
clinical-trials
bias
ocram
la source
la source
Réponses:
Tout d'abord, vous devez noter le contexte: cela ne s'applique que lorsque l'essai a été arrêté tôt en raison d'une surveillance intermédiaire montrant l'efficacité / la futilité, et non pour une raison extérieure aléatoire. Dans ce cas, l' estimation de la taille de l'effet sera biaisée dans un sens complètement statistique. Si vous vous êtes arrêté pour l'efficacité, l'effet estimé sera trop élevé (en supposant qu'il est positif), si vous vous êtes arrêté pour la futilité, il sera trop faible.
Piantodosi donne également une explication intuitive (Sec 10.5.4 dans mon édition). Supposons que la vraie différence entre deux moyennes soit de 1 unité. Lorsque vous exécutez de nombreux essais et que vous les examinez au moment de votre analyse intermédiaire, certains d'entre eux auront observé des tailles d'effet bien supérieures à 1, d'autres bien inférieures à 1, et la plupart autour de 1 - la distribution sera large, mais symétrique. La taille estimée de l'effet à ce stade ne serait pas très précise, mais serait non biaisée. Cependant, vous ne vous arrêtez et ne signalez une taille d'effet que si la différence est significative (ajustée pour plusieurs tests), c'est-à-dire que l'estimation est élevée. Dans tous les autres cas, vous continuez et ne déclarez pas d'estimation. Cela signifie que condition d'avoir arrêté tôt, la distribution de la taille de l'effet n'est pas symétrique et sa valeur attendue est supérieure à la valeur réelle de l'estimation.
Le fait que cet effet soit plus sévère au début provient du plus grand obstacle à l'arrêt de l'essai, donc une plus grande partie de la distribution est jetée pendant le conditionnement.
la source
Voici une illustration de la façon dont le biais peut survenir dans les conclusions, et pourquoi ce n'est peut-être pas l'histoire complète. Supposons que vous ayez un essai séquentiel d'un médicament qui devrait avoir un effet positif (+1) mais peut avoir un effet négatif (-1). Cinq cobayes sont testés l'un après l'autre. La probabilité inconnue d'un résultat positif dans un seul cas est en fait et un résultat négatif . 134 14
Donc, après cinq essais, les probabilités des différents résultats sont
la probabilité d'un résultat positif global est donc de 918/1024 = 0,896, et le résultat moyen est de +2,5. Divisé par les 5 essais, il s'agit d'une moyenne de +0,5 résultat par essai.
Il s'agit du chiffre non biaisé, car il est également .+ 1 × 34- 1 × 14
Supposons que, pour protéger les cobayes, l'étude soit interrompue si, à un stade quelconque, le résultat cumulatif est négatif. Alors les probabilités deviennent
la probabilité d'un résultat positif global est donc de 702/1024 = 0,6885, et le résultat moyen est de +1,953. Si nous avons examiné la valeur moyenne des résultats par essai dans le calcul précédent, c'est-à-dire en utilisant , , , , et alors nous obtiendrions +0.184. +3+ 55 +1+ 35 -1+ 15 -1- 15 -1- 13 - 11
Ce sont les sens dans lesquels il y a biais en s'arrêtant tôt dans le deuxième schéma, et le biais est dans la direction prévue. Mais ce n'est pas toute l'histoire.
Pourquoi est-ce que whuber et probabiliste pensent que l'arrêt précoce devrait produire des résultats non biaisés? Nous savons que le résultat escompté des essais du deuxième schéma est +1,953. Le nombre prévu d'essais se révèle être de 3 906. Donc, en divisant l'un par l'autre, nous obtenons +0,5, exactement comme avant et ce qui a été décrit comme non biaisé.
la source
Eh bien, mes connaissances sur cela vient du discours solennel Harveian en 2008 http://bookshop.rcplondon.ac.uk/details.aspx?e=262 Essentiellement, au mieux de mes souvenirs les résultats seront biaisés que 1) l' arrêt précoce signifie généralement que le traitement a été plus ou moins efficace que ce que l'on espérait, et si cela est positif, alors vous pouvez capitaliser sur le hasard. Je crois que les valeurs de p sont calculées sur la base de la taille d'échantillon prévue (mais je peux me tromper à ce sujet), et aussi si vous vérifiez constamment vos résultats pour voir si des effets ont été montrés, vous devez corriger les comparaisons multiples afin de vous assurer que vous ne trouvez pas simplement un effet de hasard. Par exemple, si vous vérifiez 20 fois les valeurs de p inférieures à 0,05 puis statistiquement parlant, vous êtes presque certain de trouver un résultat significatif.
la source
Je ne serais pas d'accord avec cette affirmation, sauf si par "biais" Piantadosi signifie cette partie de l'exactitude qui est communément appelée biais. L'inférence ne sera pas "biaisée" parce que vous avez choisi d'arrêter en soi: elle sera "biaisée" parce que vous avez moins de données. Le soi-disant «principe de vraisemblance» stipule que l'inférence ne devrait dépendre que des données qui ont été observées, et non des données qui auraient pu être observées, mais qui ne l'ont pas été. Le LP dit
Où représente l'hypothèse que vous testez (sous la forme d'une proposition, telle que «le traitement a été efficace»), représente les données que vous avez réellement observées et représente la proposition «l'expérience a été arrêtée tôt», et représente les informations préalables (comme un modèle). Supposons maintenant que votre règle d'arrêt dépend des données et des informations antérieures , vous pouvez donc écrire . Maintenant, une règle élémentaire de la logique est - dire que A est vrai deux fois est la même chose que le dire une fois. Cela signifie que parce que sera vrai chaque fois que etD S I D I S = g ( D , I ) A A = A S = g ( D , I ) D I D , S , I = D , g ( D , I ) , I = D , I D IH ré S je ré je S= g( D , I) A A = A S= g( D , I) ré je aussi vrai. Ainsi , dans " l' algèbre de Boole" nous avons . Cela prouve l'équation ci-dessus du principe de vraisemblance. Ce n'est que si votre règle d'arrêt dépend d'autre chose que des données ou des informations préalables qu'elle importe.D , S, Je= D , g( D , I) , Je= D , I ré je
la source
il y aura un biais (au "sens statistique") si la fin des études n'est pas aléatoire.
Dans un ensemble d'expériences menées à terme, les résultats "précoces" de (a) certaines expériences qui finalement ne trouvent "aucun effet" montreront un certain effet (par hasard) et (b) certaines expériences qui finalement trouveront un l'effet montrera «aucun effet» (probablement en raison d'un manque de puissance). Dans un monde où vous mettez fin aux essais, si vous arrêtez (a) plus souvent que (b), vous vous retrouverez à travers une série d'études avec un biais en faveur de la recherche d'un effet. (La même logique s'applique pour les tailles d' effet ; terminer les études qui montrent un effet "plus grand que prévu" plus tôt que celles qui montrent "comme prévu ou plus bas" gonflera le nombre de résultats de "grand effet".)
Si, en fait, les essais médicaux sont interrompus lorsque les premiers résultats montrent un effet positif - afin de rendre le traitement disponible pour les sujets sous placebo ou autres - mais pas lorsque les premiers résultats ne sont pas concluants, alors il y aura plus d'erreur de type 1 dans ces tests que il y en aurait si toutes les expériences étaient menées à terme. Mais cela ne signifie pas que la pratique est mauvaise; moralement parlant, le coût d'une erreur de type 1 pourrait être inférieur à celui de refuser un traitement aussi rapidement qu'on le ferait autrement pour des traitements qui se révéleraient réellement efficaces à la fin d'un essai complet.
la source