(Références) Comment dériver des modèles de conception expérimentale, au lieu de simplement les mémoriser?

8

Dans la classe de méthodes statistiques au niveau MS que je prends, j'ai appris différents modèles linéaires pour la conception expérimentale. Prenons, par exemple, pour le modèle RCBD (Randomized Complete Block Design) ( représentant le bloc, représentant les traitements), représentant les effets de bloc, les effets de traitement (fixes), suivant une distribution .

Ouijej=μ+βje+τj+εjej,
jejβτεjejN(0,σε2)

Aussi intuitif que ce modèle puisse paraître, je voudrais approfondir un niveau et comprendre comment ce modèle est dérivé, plutôt que de simplement mémoriser l'équation.

Question: Quelqu'un peut-il me référer à une source qui dériverait cette équation pour le RCBD et d'autres modèles de conception expérimentale?

Modifié en raison de la réponse : la raison pour laquelle je pose cette question est que, dans les réponses planes de Christansen aux questions complexes (annexe G), il dérive l'équation d'échantillonnage aléatoire simple , l'équation de conception entièrement randomisée et l'équation de conception de blocs complets randomisés comme "bonnes approximations des modèles les plus appropriés basés sur la théorie de la randomisation". Plus tôt, il déclareyje=μ+ejeyjej=μje+ejejyij=αi+βj+eij

[La statistique] a traditionnellement désigné la théorie de la randomisation comme un domaine de statistiques non paramétriques. La théorie de la randomisation présente également un intérêt particulier pour la théorie de la conception expérimentale car la randomisation a été utilisée pour justifier l'analyse des expériences conçues.

Donc, je suppose que ce que je demande vraiment, c'est un livre sur la théorie de la randomisation qui couvre les dérivations de ces équations et similaires, liées à la conception expérimentale.

Exemple d'une telle preuve (tirée de Christiansen): supposons que les observations soient choisies au hasard (sans remplacement) à partir d'une population finie plus grande (hypothèse simple d'échantillonnage aléatoire faite à partir de la théorie de la randomisation). Supposons que les éléments de la population soient . On peut définir des variables aléatoires d'échantillonnage élémentaire pouryis1,,sNi=1,,n et j=1,,N:

δji={1,yi=sj0,otherwise.
En utilisant un échantillonnage aléatoire simple sans remplacement,
E[δji]=P(δji=1)=1N
E[δjjeδjje]=P(δjjeδjje=1)={1/N(je,j)=(je,j)1/[N(N-1)]jeje,jj0autrement.
Si nous écrivons μ=j=1Nsj/N et σ2=j=1N(sj-μ)2/N, puis
yje=j=1Nδjjesj=μ+j=1Nδjje(sj-μ)
Location eje=j=1Nδjje(sj-μ) donne le modèle linéaire
yje=μ+eje.
Clarinettiste
la source
Peut-être avez-vous besoin de meilleurs livres sur la conception expérimentale. Voir stats.stackexchange.com/questions/179067/… stats.stackexchange.com/questions/1815/…
kjetil b halvorsen

Réponses:

5

Vous demandez une dérivation, mais je dirais que cette formule n'est pas dérivable. Il est autonome en tant qu'encodage mathématique du monde extérieur. Le calcul ne se soucie pas de ce qu'est un "bloc", mais vous le faites. Et si vous croyez qu'il peut être modélisé comme une source additive de variation, vous vous retrouverez probablement avec le modèle linéaire que vous avez proposé ci-dessus. Mais les blocs pourraient interagir avec les traitements, par exemple, et le modèle que vous avez proposé ci-dessus serait alors erroné. Vous ne pouvez pas déterminer quel est le "bon" modèle pour le monde.

Vous avez demandé des références, et peut-être un bon endroit pour regarder serait certains des écrits de RA Fisher sur la conception expérimentale comme La conception des expériences (1960) . Il n'évoque même pas le modèle linéaire et se concentre plutôt sur le partitionnement de la variance via une analyse de la variance. Je suis curieux de savoir si Fisher pensait même en termes de modèle linéaire au moment où il partitionnait la variance de cette façon, et peut-être que la chose la plus proche d'une dérivation serait de montrer l'équivalence de l'analyse classique de la variance et du linéaire modèle, si vous prenez le premier pour aller de soi.

Ben Ogorek
la source
2
Merci d'avoir répondu à cette très vieille question. Je vais modifier la question d'origine pour fournir plus de détails, mais la raison pour laquelle je pose cette question est parce que dans les réponses planes de Christansen aux questions complexes (annexe G), il dérive l'équation d'échantillonnage aléatoire simpleyje=μ+eje, l'équation de conception complètement randomisée yjej=μje+ejej et l'équation de conception de bloc complet randomisé yjej=αje+βj+ejejcomme "de bonnes approximations des modèles les plus appropriés basés sur la théorie de la randomisation."
Clarinettiste
1
Plus tôt, il déclare: "[La] statistique a traditionnellement désigné la théorie de la randomisation comme un domaine de statistiques non paramétriques. La théorie de la randomisation est également d'un intérêt particulier dans la théorie de la conception expérimentale parce que la randomisation a été utilisée pour justifier l'analyse des expériences conçues." Donc, je suppose que ce que je demande vraiment, c'est un livre sur la théorie de la randomisation.
Clarinettiste
1
Votre question prend une tournure intéressante. Je ne pensais certainement pas à la théorie de la randomisation. Je suppose que cela impliquerait une définition des effets de bloc en termes de membres de la population finie, et peut-être qu'un tel modèle pourrait alors être «dérivé». J'espère que nous verrons une réponse comme celle-ci se concrétiser.
Ben Ogorek