Le bloc est un facteur. L'objectif principal du blocage est de réduire la variation inexpliquée d'une conception - par rapport à une conception non bloquée -. Nous ne nous intéressons pas à l'effet de blocage en soi , mais plutôt à un blocage lorsque nous soupçonnons que le «bruit» de fond pourrait fonder l'effet du facteur réel.(SSResidual)
Nous regroupons les unités expérimentales en blocs "homogènes" où tous les niveaux du facteur principal sont également représentés. L'analyse de la variance d'une conception de blocs de contrôle randomisés divise le terme résiduel d'une conception randomisée complète à facteur unique équivalent en blocs et en composants résiduels. Il convient toutefois de noter que cette dernière composante a moins de degrés de liberté que dans les plans CR à facteur unique, ce qui conduit à des estimations plus élevées pour .MSResidual=SSResidual/d.f.
La décision de bloquer ou de ne pas bloquer doit être prise lorsque l'on considère que la diminution des résidus compensera largement la diminution de df
Habituellement, un modèle additif est ajusté aux données de conception du RCB, dans lequel la variable de réponse est une combinaison additive du facteur et des effets de bloc et il est supposé qu'aucune interaction n'existe entre les deux. Je pense que cela s'explique par le fait que le RCB ne nous permet pas de distinguer l'interaction BxF de la variabilité intra bloc et de la variabilité intra unités expérimentales. L'essentiel est que nous ne devons assumer aucune interaction car nous ne pouvons pas la mesurer. Cependant, nous pouvons tester s'il est présent visuellement ou avec le test de Tukey.
Une bonne ressource sur la conception expérimentale est ce .
Voici une réponse concise. Beaucoup de détails et d'exemples peuvent être trouvés dans la plupart des documents traitant de la conception des expériences; surtout en agronomie.
Souvent, le chercheur n'est pas intéressé par l'effet de bloc en soi, mais il veut seulement tenir compte de la variabilité de la réponse entre les blocs. Donc, j'utilise pour voir le bloc comme un facteur avec un rôle particulier. Il convient de noter que l'effet de bloc est généralement considéré comme un effet aléatoire. Enfin, si vous vous attendez à ce que «l'effet du traitement» diffère d'un bloc à l'autre, alors les interactions doivent être envisagées.
la source
Voici une paraphrase de mon explication préférée, de mon ancien professeur Freedom King.
Vous étudiez comment la pâte à pain et la température de cuisson affectent la saveur du pain. Vous avez une échelle de notation pour le goût. Et disons que vous achetez de la pâte à pain emballée auprès d'une entreprise alimentaire plutôt que de la mélanger vous-même. Chaque miche de pain cuite est une unité expérimentale.
Disons que vous avez 2 pâtes et 8 températures, vous pouvez mettre 4 miches de pain dans le four à la fois et vous voulez courirn = 160 pains.
Dans un environnement complètement aléatoire2 × 2 disposition factorielle (pas de blocs), vous décideriez complètement au hasard de l'ordre dans lequel les pains sont cuits. Pour chaque pain, vous devez préchauffer le four, ouvrir un paquet de pâte à pain et le faire cuire. Cela impliquerait d'exécuter le four 160 fois, une fois pour chaque miche de pain.
Vous pouvez également traiter le fonctionnement du four comme un facteur de blocage . Dans ce cas, vous feriez fonctionner le four 40 fois, ce qui pourrait accélérer la collecte des données. Chaque four aurait quatre pains, mais pas nécessairement deux de chaque type de pâte. (La proportion exacte serait choisie au hasard.) Vous auriez 5 cycles de four pour chaque température; cela pourrait vous aider à tenir compte de la variabilité entre les cycles de four à même température.
Même plus amateur, vous pouvez bloquer la pâte ainsi que la cuisson au four. Dans cette conception, vous auriez exactement deux de chaque type de pâte dans chaque four.
Lorsque j'aurai le temps d'y réfléchir, je mettrai à jour cela avec les noms de fantaisie appropriés pour ces conceptions d'expérience.
la source
Les plans expérimentaux sont une combinaison de trois structures:
Les blocs sont des "facteurs" qui appartiennent à la structure de conception (pour distinguer, ce n'est pas une mauvaise idée de les appeler "facteurs de blocage" vs "facteurs de traitement"). Ce sont de bons exemples de paramètres de nuisance : des paramètres de modèle que vous devez avoir et dont vous devez tenir compte, mais dont les valeurs ne sont pas particulièrement intéressantes. Veuillez noter que cela n'a rien à voir avec la nature d'un facteur - les facteurs de blocage peuvent être fixes ou aléatoires, tout comme les facteurs de traitement peuvent être fixes ou aléatoires.
Ma règle d'or personnelle concernant la place d'un facteur dans un plan expérimental est la suivante: si je veux estimer les paramètres associés au facteur et les comparer soit à l'intérieur du facteur, soit à d'autres paramètres de facteur, il appartient à la structure de traitement. Si je ne me soucie pas des valeurs des paramètres associés et ne me soucie pas de les comparer, le facteur appartient à la structure de conception.
Ainsi, dans l'exemple de pain ailleurs dans ce fil, je dois m'inquiéter des différences d'exécution à exécution. Mais je ne me soucie pas de comparer Run 1 vs Run 24. Le fonctionnement du four appartient à la structure de conception . Je ne veux comparer les deux recettes pâte: recette appartient à la structure de traitement. Je me soucie de la température du four: cela appartient aussi à la structure de traitement. Construisons une conception expérimentale.
La structure de conception a un facteur (fonctionnement du four, fonctionnement) et la structure de traitement deux facteurs (recette et température). Étant donné que chaque analyse doit être une seule température (nominale), la température et l'analyse doivent se produire au même niveau de la conception expérimentale. Cependant, il y a de la place pour 4 pains dans chaque exécution. Évidemment, nous pouvons choisir de cuire 1, 2, 3 ou 4 pains par cycle.
Si nous préparons un pain par cycle et randomisons l'ordre de présentation des recettes, nous obtenons une structure de conception entièrement aléatoire (CRD). Si nous cuisons deux pains, un de chaque recette par cycle, nous avons une structure de conception de blocs complets randomisés (RCB). Veuillez noter qu'il est important que chaque recette se produise dans chaque exécution. Sans cet équilibre, les comparaisons de recettes seront contaminées par les différences d'exécution. Rappelez-vous: le but du blocage est de se débarrasser des différences de course. Si nous cuisons trois pains par Run, nous serions probablement fous: 3 n'est pas un facteur de 160, nous aurons donc un ou deux blocs de tailles différentes. L'autre possibilité raisonnable est de quatre pains par cycle. Dans ce cas, nous cuire deux pains de chaque recette dans chaque exécution. Encore une fois, il s'agit d'une structure RCB. Nous pouvons estimer la variabilité intra-série en utilisant les différences entre les deux pains de chaque recette dans chaque série.
Si nous choisissons l'une des structures de conception RCB, les effets de la température sont complètement aléatoires au niveau de l'exécution. La recette est imbriquée dans la température et a une structure d'erreur différente de la température, car chaque pâte apparaît dans chaque cycle. Les contrastes observant recette et recette par non-additivité de la pâte (interaction) n'ont pas de variabilité de cycle à cycle. Techniquement, cela s'appelle diversement une structure de conception à parcelles divisées ou une structure de conception à mesures répétées .
Que l'enquêteur utiliserait-il? Probablement le RCB avec quatre pains: 40 runs vs 80 vs 160 a beaucoup de poids. Cependant, cela peut être modifié - si le problème concerne les fours domestiques plutôt que la production industrielle, il peut bien y avoir des raisons d'utiliser le CRD si l'on pense que les boulangers à domicile cuisent rarement plusieurs pains.
la source
Je pense que la plupart du temps, c'est juste une question de convention, probablement propre à chaque domaine. Je pense que dans le contexte médical, dans un des deux facteurs anova l'un des facteurs est presque toujours appelé «traitement» et l'autre «bloc».
En règle générale, comme le dit ocram, l'effet de blocage sera un effet aléatoire, mais je ne pense pas que ce soit systématique. Disons que vous souhaitez évaluer l'efficacité de différents traitements médicaux:
Première conception: chaque patient ne prend qu'un seul traitement et l'efficacité est mesurée sur une échelle appropriée. Vous soupçonnez que le sexe du patient présente un intérêt: vous aurez un «bloc» de mâles et un bloc de patientes. Dans ce cas, le bloc est un facteur à effet fixe.
Deuxième conception: chaque patient essaie tous les traitements à différents moments. Comme il existe une certaine variabilité entre les patients, vous considérez chaque patient comme un "bloc". Vous vous intéressez à l'existence d'une telle variabilité dans la population, mais pas à sa valeur chez ces patients particuliers. Dans ce cas, le bloc est un facteur à effet aléatoire.
Eh bien, je n'enseigne que ce genre de choses, en essayant de respecter les conventions du domaine (en France) car je les ai obtenues dans des manuels, mais je n'ai jamais participé à un essai clinique (et je ne veux pas) ... c'est donc juste mes deux cents...!
la source
example(aov)
ou le paquet R agricolae ? :-)