L'attribution aléatoire est précieuse car elle garantit l'indépendance du traitement par rapport aux résultats potentiels. C'est ainsi que cela conduit à des estimations non biaisées de l'effet moyen du traitement. Mais d'autres schémas d'affectation peuvent également garantir systématiquement l'indépendance du traitement par rapport aux résultats potentiels. Alors pourquoi avons-nous besoin d'une assignation aléatoire? Autrement dit, quel est l'avantage de l'assignation aléatoire par rapport aux schémas d'assignation non aléatoires qui conduisent également à une inférence non biaisée?
Soit un vecteur d'affectations de traitement dans lequel chaque élément est 0 (unité non affectée au traitement) ou 1 (unité affectée au traitement). Dans un article de JASA, Angrist, Imbens et Rubin (1996, 446-47) disent que l'affectation de traitement est aléatoire si pour tous \ mathbf {c} et \ mathbf {c'} tels que \ iota ^ T \ mathbf {c} = \ iota ^ T \ mathbf {c '} , où \ iota est un vecteur de colonne avec tous les éléments égaux à 1.c ′ ι T c = ι T c ′ ι
En d'autres termes, l'affirmation est que l'affectation est aléatoire si tout vecteur d'affectations qui comprend affectations au traitement est aussi probable que tout autre vecteur qui comprend affectations au traitement.
Mais, pour garantir l'indépendance des résultats potentiels de l'attribution du traitement, il suffit de s'assurer que chaque unité de l'étude a une probabilité égale d'assignation au traitement. Et cela peut facilement se produire même si la plupart des vecteurs d'attribution de traitement ont une probabilité nulle d'être sélectionnés. Autrement dit, cela peut se produire même dans le cadre d'une affectation non aléatoire.
Voici un exemple. Nous voulons exécuter une expérience avec quatre unités dans lesquelles exactement deux sont traitées. Il existe six vecteurs d'affectation possibles:
- 1100
- 1010
- 1001
- 0110
- 0101
- 0011
où le premier chiffre de chaque numéro indique si la première unité a été traitée, le deuxième chiffre indique si la deuxième unité a été traitée, etc.
Supposons que nous exécutons une expérience dans laquelle nous excluons la possibilité d'assigner les vecteurs 3 et 4, mais dans laquelle chacun des autres vecteurs a une chance égale (25%) d'être choisi. Ce schéma n'est pas une attribution aléatoire au sens AIR. Mais dans l'attente, cela conduit à une estimation non biaisée de l'effet moyen du traitement. Et ce n'est pas un hasard. Tout schéma d'attribution qui donne aux sujets une probabilité égale d'assignation au traitement permettra une estimation non biaisée de l'ETA.
Alors: pourquoi avons-nous besoin d'une affectation aléatoire au sens AIR? Mon argument est enraciné dans l'inférence de randomisation; si l'on pense plutôt en termes d'inférence basée sur un modèle, la définition d'AIR semble-t-elle plus défendable?
la source
Réponses:
Cela fait suite au commentaire de Gung. L'effet global moyen du traitement n'est pas la question.
Supposons que vous ayez nouveaux cas de diabète où le sujet a entre et et nouveaux patients diabétiques de plus de . Vous souhaitez affecter la moitié au traitement. Pourquoi ne pas lancer une pièce, et sur la tête, traiter tous les jeunes patients, et sur la queue, traiter tous les patients plus âgés? Chacun aurait un5 15 1000 30 50 % 5001000 5 15 1000 30 50% chance d'être sélectionné pour le traitement, donc cela ne fausserait pas le résultat moyen du traitement, mais cela jetterait beaucoup d'informations. Il ne serait pas surprenant que le diabète juvénile ou les patients plus jeunes se révèlent beaucoup mieux ou pires que les patients plus âgés atteints de diabète de type II ou gestationnel. L'effet de traitement observé pourrait être non biaisé mais, par exemple, il aurait un écart-type beaucoup plus important que celui qui se produirait par assignation aléatoire, et malgré le grand échantillon, vous ne seriez pas en mesure de dire grand-chose. Si vous utilisez l'assignation aléatoire, alors avec une probabilité élevée, environ cas dans chaque groupe d'âge recevront le traitement, vous pourrez donc comparer le traitement sans traitement dans chaque groupe d'âge. 500
Vous pourrez peut-être faire mieux que d'utiliser l'assignation aléatoire. Si vous remarquez un facteur qui, selon vous, pourrait influer sur la réponse au traitement, vous voudrez peut-être vous assurer que les sujets avec cet attribut sont divisés plus uniformément que ce qui se produirait lors de l'assignation aléatoire. L'affectation aléatoire vous permet de faire raisonnablement bien avec tous les facteurs simultanément, de sorte que vous pouvez analyser de nombreux modèles possibles par la suite.
la source
Dans votre exemple, vous pouvez également laisser de côté 2 et 5 et ne pas vous contredire. Au niveau d'un objet, il y a toujours une chance égale d'être 1 ou 0 quand il n'y a qu'une chance de 1: 1 de sélectionner 1 ou 6. Mais, maintenant, ce que vous avez fait en supprimant 3 et 4 devient plus évident.
la source
Voici une autre des variables cachées ou déroutantes: le temps (ou la dérive instrumentale, les effets du stockage des échantillons, etc.).
Il y a donc des arguments contre la randomisation (comme le dit Douglas: vous pouvez faire mieux que la randomisation). Par exemple, vous pouvez savoir à l'avance que vous souhaitez que vos cas soient équilibrés dans le temps. Tout comme vous pouvez savoir à l'avance que vous souhaitez équilibrer le sexe et l'âge.
En d'autres termes, si vous souhaitez choisir manuellement l'un de vos 6 schémas, je dirais que 1100 (ou 0011) est un mauvais choix. Notez que les premières possibilités que vous avez rejetées sont celles qui sont les plus équilibrées dans le temps ... Et les deux pires sont restés après que John ait proposé de sortir également 2 et 5 (contre lesquels vous n'avez pas protesté).
En d'autres termes, votre intuition sur les schémas qui sont "agréables" mène malheureusement à une mauvaise conception expérimentale (à mon humble avis, cela est assez courant; peut-être que les choses ordonnées sont plus belles - et il est sûr plus facile de garder une trace des séquences logiques pendant l'expérience).
Vous pouvez peut-être faire mieux avec des schémas non randomisés, mais vous pouvez également faire bien pire. À mon humble avis, vous devriez être en mesure de donner des arguments physiques / chimiques / biologiques / médicaux / ... pour le schéma non aléatoire particulier que vous utilisez, si vous optez pour un schéma non aléatoire.
la source