Qu'est-ce qu'un bloc dans la conception expérimentale?

20

J'ai deux questions sur la notion de bloc dans la conception expérimentale: (1) Quelle est la différence entre un bloc et un facteur? (2) J'ai essayé de lire quelques livres mais quelque chose n'est pas clair: il semble que les auteurs supposent toujours qu'il n'y a pas d'interaction entre le "facteur bloc" et d'autres facteurs. Est-ce juste, et si c'est le cas, pourquoi?

Stéphane Laurent
la source

Réponses:

13
  1. Le bloc est un facteur. L'objectif principal du blocage est de réduire la variation inexpliquée d'une conception - par rapport à une conception non bloquée -. Nous ne nous intéressons pas à l'effet de blocage en soi , mais plutôt à un blocage lorsque nous soupçonnons que le «bruit» de fond pourrait fonder l'effet du facteur réel.(SSResidual)
    Nous regroupons les unités expérimentales en blocs "homogènes" où tous les niveaux du facteur principal sont également représentés. L'analyse de la variance d'une conception de blocs de contrôle randomisés divise le terme résiduel d'une conception randomisée complète à facteur unique équivalent en blocs et en composants résiduels. Il convient toutefois de noter que cette dernière composante a moins de degrés de liberté que dans les plans CR à facteur unique, ce qui conduit à des estimations plus élevées pour .MSResidual=SSResidual/d.f.
    La décision de bloquer ou de ne pas bloquer doit être prise lorsque l'on considère que la diminution des résidus compensera largement la diminution de df

  2. Habituellement, un modèle additif est ajusté aux données de conception du RCB, dans lequel la variable de réponse est une combinaison additive du facteur et des effets de bloc et il est supposé qu'aucune interaction n'existe entre les deux. Je pense que cela s'explique par le fait que le RCB ne nous permet pas de distinguer l'interaction BxF de la variabilité intra bloc et de la variabilité intra unités expérimentales. L'essentiel est que nous ne devons assumer aucune interaction car nous ne pouvons pas la mesurer. Cependant, nous pouvons tester s'il est présent visuellement ou avec le test de Tukey.

Une bonne ressource sur la conception expérimentale est ce .

Charlie
la source
(+1) Une autre bonne lecture est la conception et l'analyse des expériences de Montgomery .
chl
Merci @chl. Montgomery's était sur ma liste de courses mais j'ai choisi de ne pas l'acheter car il était plus tourné vers l'ingénierie que l'écologie. J'ai remarqué qu'une nouvelle édition devrait être publiée en avril 2012, allez-vous y mettre à jour votre compagnon R?
Charlie
1
Merci à tous. J'ai plutôt un esprit mathématique, alors j'ai du mal à lire des livres comme celui de Montgomery dans lequel il y a trop de texte et pas assez de mathématiques
Stéphane Laurent
@Charlie Yup, c'est un projet qui remonte à 2006, lorsque la vue de tâche Doe CRAN n'existait pas du tout. Je vais continuer à travailler sur la 6ème version avec l'espoir de la finir cette année (mais je dis ça à chaque nouvelle année, donc ...). Outre le champ d'application «biaisé», je pense toujours que le texte reste excellent pour les psychologues et les biologistes.
chl
1
@ Stéphane Je peux suggérer de jeter un coup d'œil aux réponses planes aux questions complexes , par Christensen: moins de DoE, plus de mathématiques et une belle introduction aux modèles linéaires.
chl
8

Voici une réponse concise. Beaucoup de détails et d'exemples peuvent être trouvés dans la plupart des documents traitant de la conception des expériences; surtout en agronomie.

Souvent, le chercheur n'est pas intéressé par l'effet de bloc en soi, mais il veut seulement tenir compte de la variabilité de la réponse entre les blocs. Donc, j'utilise pour voir le bloc comme un facteur avec un rôle particulier. Il convient de noter que l'effet de bloc est généralement considéré comme un effet aléatoire. Enfin, si vous vous attendez à ce que «l'effet du traitement» diffère d'un bloc à l'autre, alors les interactions doivent être envisagées.

ocram
la source
7

Voici une paraphrase de mon explication préférée, de mon ancien professeur Freedom King.

Vous étudiez comment la pâte à pain et la température de cuisson affectent la saveur du pain. Vous avez une échelle de notation pour le goût. Et disons que vous achetez de la pâte à pain emballée auprès d'une entreprise alimentaire plutôt que de la mélanger vous-même. Chaque miche de pain cuite est une unité expérimentale.

Disons que vous avez 2 pâtes et 8 températures, vous pouvez mettre 4 miches de pain dans le four à la fois et vous voulez courir n=160 pains.

Dans un environnement complètement aléatoire 2×2disposition factorielle (pas de blocs), vous décideriez complètement au hasard de l'ordre dans lequel les pains sont cuits. Pour chaque pain, vous devez préchauffer le four, ouvrir un paquet de pâte à pain et le faire cuire. Cela impliquerait d'exécuter le four 160 fois, une fois pour chaque miche de pain.

Vous pouvez également traiter le fonctionnement du four comme un facteur de blocage . Dans ce cas, vous feriez fonctionner le four 40 fois, ce qui pourrait accélérer la collecte des données. Chaque four aurait quatre pains, mais pas nécessairement deux de chaque type de pâte. (La proportion exacte serait choisie au hasard.) Vous auriez 5 cycles de four pour chaque température; cela pourrait vous aider à tenir compte de la variabilité entre les cycles de four à même température.

Même plus amateur, vous pouvez bloquer la pâte ainsi que la cuisson au four. Dans cette conception, vous auriez exactement deux de chaque type de pâte dans chaque four.

Lorsque j'aurai le temps d'y réfléchir, je mettrai à jour cela avec les noms de fantaisie appropriés pour ces conceptions d'expérience.

Thomas Levine
la source
BTW, c'est un 2×8 structure de traitement factorielle, pas un 2×2.
Dennis
Est-ce un exemple de blocage incomplet?
SmallChess
6

Les plans expérimentaux sont une combinaison de trois structures:

  1. La structure du traitement: Comment les traitements sont-ils formés à partir de facteurs d'intérêt?
  2. La structure de conception: comment les unités expérimentales sont-elles regroupées et affectées aux traitements?
  3. La structure de réponse: comment les observations sont-elles prises?

Les blocs sont des "facteurs" qui appartiennent à la structure de conception (pour distinguer, ce n'est pas une mauvaise idée de les appeler "facteurs de blocage" vs "facteurs de traitement"). Ce sont de bons exemples de paramètres de nuisance : des paramètres de modèle que vous devez avoir et dont vous devez tenir compte, mais dont les valeurs ne sont pas particulièrement intéressantes. Veuillez noter que cela n'a rien à voir avec la nature d'un facteur - les facteurs de blocage peuvent être fixes ou aléatoires, tout comme les facteurs de traitement peuvent être fixes ou aléatoires.

Ma règle d'or personnelle concernant la place d'un facteur dans un plan expérimental est la suivante: si je veux estimer les paramètres associés au facteur et les comparer soit à l'intérieur du facteur, soit à d'autres paramètres de facteur, il appartient à la structure de traitement. Si je ne me soucie pas des valeurs des paramètres associés et ne me soucie pas de les comparer, le facteur appartient à la structure de conception.

Ainsi, dans l'exemple de pain ailleurs dans ce fil, je dois m'inquiéter des différences d'exécution à exécution. Mais je ne me soucie pas de comparer Run 1 vs Run 24. Le fonctionnement du four appartient à la structure de conception . Je ne veux comparer les deux recettes pâte: recette appartient à la structure de traitement. Je me soucie de la température du four: cela appartient aussi à la structure de traitement. Construisons une conception expérimentale.

La structure de conception a un facteur (fonctionnement du four, fonctionnement) et la structure de traitement deux facteurs (recette et température). Étant donné que chaque analyse doit être une seule température (nominale), la température et l'analyse doivent se produire au même niveau de la conception expérimentale. Cependant, il y a de la place pour 4 pains dans chaque exécution. Évidemment, nous pouvons choisir de cuire 1, 2, 3 ou 4 pains par cycle.

Si nous préparons un pain par cycle et randomisons l'ordre de présentation des recettes, nous obtenons une structure de conception entièrement aléatoire (CRD). Si nous cuisons deux pains, un de chaque recette par cycle, nous avons une structure de conception de blocs complets randomisés (RCB). Veuillez noter qu'il est important que chaque recette se produise dans chaque exécution. Sans cet équilibre, les comparaisons de recettes seront contaminées par les différences d'exécution. Rappelez-vous: le but du blocage est de se débarrasser des différences de course. Si nous cuisons trois pains par Run, nous serions probablement fous: 3 n'est pas un facteur de 160, nous aurons donc un ou deux blocs de tailles différentes. L'autre possibilité raisonnable est de quatre pains par cycle. Dans ce cas, nous cuire deux pains de chaque recette dans chaque exécution. Encore une fois, il s'agit d'une structure RCB. Nous pouvons estimer la variabilité intra-série en utilisant les différences entre les deux pains de chaque recette dans chaque série.

Si nous choisissons l'une des structures de conception RCB, les effets de la température sont complètement aléatoires au niveau de l'exécution. La recette est imbriquée dans la température et a une structure d'erreur différente de la température, car chaque pâte apparaît dans chaque cycle. Les contrastes observant recette et recette par non-additivité de la pâte (interaction) n'ont pas de variabilité de cycle à cycle. Techniquement, cela s'appelle diversement une structure de conception à parcelles divisées ou une structure de conception à mesures répétées .

Que l'enquêteur utiliserait-il? Probablement le RCB avec quatre pains: 40 runs vs 80 vs 160 a beaucoup de poids. Cependant, cela peut être modifié - si le problème concerne les fours domestiques plutôt que la production industrielle, il peut bien y avoir des raisons d'utiliser le CRD si l'on pense que les boulangers à domicile cuisent rarement plusieurs pains.

Dennis
la source
2
Je ne suis pas votre analyse de l'expérience du pain, peut-être parce que plusieurs conceptions différentes de cette expérience ont été mentionnées et que vous ne spécifiez pas à laquelle vous faites référence. Cela rend la plupart de vos commentaires confus plutôt qu'éclairants. Si vous pouviez éclaircir ce point, je pense que votre réponse se démarquerait.
whuber
1
L'importance du # 2 mérite d'être soulignée. L'analyse peut être effectuée sur la base de l'assignation aléatoire des traitements expérimentaux: les blocs représentent des restrictions sur cette assignation aléatoire.
Scortchi - Réintégrer Monica
1
@whuber C'est parce que je ne l'analysais pas, je concevais une expérience à partir de ces paramètres de novo . Clarifié dans le montage.
Dennis
3

Je pense que la plupart du temps, c'est juste une question de convention, probablement propre à chaque domaine. Je pense que dans le contexte médical, dans un des deux facteurs anova l'un des facteurs est presque toujours appelé «traitement» et l'autre «bloc».

En règle générale, comme le dit ocram, l'effet de blocage sera un effet aléatoire, mais je ne pense pas que ce soit systématique. Disons que vous souhaitez évaluer l'efficacité de différents traitements médicaux:

  • Première conception: chaque patient ne prend qu'un seul traitement et l'efficacité est mesurée sur une échelle appropriée. Vous soupçonnez que le sexe du patient présente un intérêt: vous aurez un «bloc» de mâles et un bloc de patientes. Dans ce cas, le bloc est un facteur à effet fixe.

  • Deuxième conception: chaque patient essaie tous les traitements à différents moments. Comme il existe une certaine variabilité entre les patients, vous considérez chaque patient comme un "bloc". Vous vous intéressez à l'existence d'une telle variabilité dans la population, mais pas à sa valeur chez ces patients particuliers. Dans ce cas, le bloc est un facteur à effet aléatoire.

Eh bien, je n'enseigne que ce genre de choses, en essayant de respecter les conventions du domaine (en France) car je les ai obtenues dans des manuels, mais je n'ai jamais participé à un essai clinique (et je ne veux pas) ... c'est donc juste mes deux cents...!

Elvis
la source
1
Il me semble que le blocage dénote une stratégie plus générale de réduction des erreurs expérimentales (en tenant compte de l'homogénéité intra-bloc), une manifestation de cette approche étant l'utilisation de mesures répétées . Je veux dire, le blocage tel que vu dans RBD est un moyen de combiner la randomisation et le contrôle des facteurs de confusion potentiels au niveau des unités statistiques. Le blocage est également utilisé lorsque nous ne pouvons pas effectuer une réplication complète d'un (2k ou autre) conception factorielle dans un seul bloc.
chl
@chl Je pense que tu as raison! Je donnais juste quelques exemples très basiques ...
Elvis
Ils sont bons (un exemple avec une expérience de rendement / récolte en agronomie l'aurait rendu encore plus clair); Je soulignais simplement que le "blocage" s'étend au-delà du concept de "facteur" et de la distinction fixe / aléatoire.
chl
@chl, si vous avez une bonne (et simple) référence sur ce genre de choses, je serais heureux de la lire (et vous devriez poster comme réponse) ... (des références pas si simples acceptées aussi!)
Elvis
Vous voulez dire example(aov)ou le paquet R agricolae ? :-)
chl