(Références) Comment dériver des modèles de conception expérimentale, au lieu de simplement les mémoriser?

Dans la classe de méthodes statistiques au niveau MS que je prends, j'ai appris différents modèles linéaires pour la conception expérimentale. Prenons, par exemple, pour le modèle RCBD (Randomized Complete Block Design) ( représentant le bloc, représentant les traitements), représentant les effets de bloc, les effets de traitement (fixes), suivant une distribution .

{Oui}_{je j} = μ + β_{je} + τ_{j} + ε_{je j},

$Y_{ij} = \mu + \beta_i + \tau_j + \varepsilon_{ij}\,,$

i

$i$

j

$j$

β

$\beta$

τ

$\tau$

ε_{i j}

$\varepsilon_{ij}$

N (0, σ_{ε}^{2})

$\mathcal{N}(0, \sigma^2_{\varepsilon})$

Aussi intuitif que ce modèle puisse paraître, je voudrais approfondir un niveau et comprendre comment ce modèle est dérivé, plutôt que de simplement mémoriser l'équation.

Question: Quelqu'un peut-il me référer à une source qui dériverait cette équation pour le RCBD et d'autres modèles de conception expérimentale?

Modifié en raison de la réponse : la raison pour laquelle je pose cette question est que, dans les réponses planes de Christansen aux questions complexes (annexe G), il dérive l'équation d'échantillonnage aléatoire simple , l'équation de conception entièrement randomisée et l'équation de conception de blocs complets randomisés comme "bonnes approximations des modèles les plus appropriés basés sur la théorie de la randomisation". Plus tôt, il déclare $y_i = \mu + e_i$ $y_{ij} = \mu_i + e_{ij}$ $y_{ij} = \alpha_i + \beta_j + e_{ij}$

[La statistique] a traditionnellement désigné la théorie de la randomisation comme un domaine de statistiques non paramétriques. La théorie de la randomisation présente également un intérêt particulier pour la théorie de la conception expérimentale car la randomisation a été utilisée pour justifier l'analyse des expériences conçues.

Donc, je suppose que ce que je demande vraiment, c'est un livre sur la théorie de la randomisation qui couvre les dérivations de ces équations et similaires, liées à la conception expérimentale.

Exemple d'une telle preuve (tirée de Christiansen): supposons que les observations soient choisies au hasard (sans remplacement) à partir d'une population finie plus grande (hypothèse simple d'échantillonnage aléatoire faite à partir de la théorie de la randomisation). Supposons que les éléments de la population soient . On peut définir des variables aléatoires d'échantillonnage élémentaire pour $y_i$ $s_1, \dots, s_N$ $i = 1, \dots, n$ et $j = 1, \dots, N$ :

δ_{j}^{i} = {\begin{cases} 1, & y_{i} = s_{j} \\ 0, & otherwise. \end{cases}

$\delta^{i}_j = \begin{cases} 1, & y_i = s_j \\ 0, & \text{otherwise.} \end{cases}$ En utilisant un échantillonnage aléatoire simple sans remplacement,

E [δ_{j}^{i}] = P (δ_{j}^{i} = 1) = \frac{1}{N}

$\mathbb{E}[\delta^{i}_j] = \mathbb{P}(\delta^{i}_j = 1) = \dfrac{1}{N}$

E [δ_{j}^{je} δ_{j^{'}}^{{je}^{'}}] = P (δ_{j}^{je} δ_{j^{'}}^{{je}^{'}} = 1) = {\begin{cases} 1 / N & (je, j) = ({je}^{'}, j^{'}) \\ 1 / [N (N - 1)] & je \neq {je}^{'}, j \neq j^{'} \\ 0 & autrement. \end{cases}

$\mathbb{E}[\delta^{i}_j\delta^{i^{\prime}}_{j^{\prime}}] = \mathbb{P}(\delta^{i}_j\delta^{i^{\prime}}_{j^{\prime}} = 1) = \begin{cases} 1/N & (i, j) = (i^{\prime}, j^{\prime}) \\ 1/[N(N-1)] & i \neq i^{\prime}, j \neq j^{\prime} \\ 0 & \text{otherwise.} \end{cases}$ Si nous écrivons

μ = \sum_{j = 1}^{N} s_{j} / N

$\mu = \sum_{j=1}^{N}s_j / N$ et

σ^{2} = \sum_{j = 1}^{N} (s_{j} - μ)^{2} / N

$\sigma^2 = \sum_{j=1}^{N}(s_j - \mu)^2/N$ , puis

y_{je} = \sum_{j = 1}^{N} δ_{j}^{je} s_{j} = μ + \sum_{j = 1}^{N} δ_{j}^{je} (s_{j} - μ)

$y_i = \sum_{j=1}^{N}\delta^{i}_js_j = \mu+\sum_{j=1}^{N}\delta^{i}_{j}(s_j - \mu)$ Location

e_{i} = \sum_{j = 1}^{N} δ_{j}^{i} (s_{j} - μ)

$e_i = \sum_{j=1}^{N}\delta^{i}_{j}(s_j - \mu)$ donne le modèle linéaire

y_{je} = μ + e_{je} .

$y_i = \mu + e_i\text{.}$

references experiment-design fixed-effects-model theory Clarinettiste
la source

Peut-être avez-vous besoin de meilleurs livres sur la conception expérimentale. Voir stats.stackexchange.com/questions/179067/… stats.stackexchange.com/questions/1815/…

kjetil b halvorsen

stats.stackexchange.com/questions/129485/…

kjetil b halvorsen

Vous demandez une dérivation, mais je dirais que cette formule n'est pas dérivable. Il est autonome en tant qu'encodage mathématique du monde extérieur. Le calcul ne se soucie pas de ce qu'est un "bloc", mais vous le faites. Et si vous croyez qu'il peut être modélisé comme une source additive de variation, vous vous retrouverez probablement avec le modèle linéaire que vous avez proposé ci-dessus. Mais les blocs pourraient interagir avec les traitements, par exemple, et le modèle que vous avez proposé ci-dessus serait alors erroné. Vous ne pouvez pas déterminer quel est le "bon" modèle pour le monde.

Vous avez demandé des références, et peut-être un bon endroit pour regarder serait certains des écrits de RA Fisher sur la conception expérimentale comme La conception des expériences (1960) . Il n'évoque même pas le modèle linéaire et se concentre plutôt sur le partitionnement de la variance via une analyse de la variance. Je suis curieux de savoir si Fisher pensait même en termes de modèle linéaire au moment où il partitionnait la variance de cette façon, et peut-être que la chose la plus proche d'une dérivation serait de montrer l'équivalence de l'analyse classique de la variance et du linéaire modèle, si vous prenez le premier pour aller de soi.

Ben Ogorek
la source

Merci d'avoir répondu à cette très vieille question. Je vais modifier la question d'origine pour fournir plus de détails, mais la raison pour laquelle je pose cette question est parce que dans les réponses planes de Christansen aux questions complexes (annexe G), il dérive l'équation d'échantillonnage aléatoire simple

y_{i} = μ + e_{i}

$y_i = \mu + e_i$ , l'équation de conception complètement randomisée

y_{i j} = μ_{i} + e_{i j}

$y_{ij} = \mu_i + e_{ij}$ et l'équation de conception de bloc complet randomisé

y_{i j} = α_{i} + β_{j} + e_{i j}

$y_{ij} = \alpha_i + \beta_j + e_{ij}$ comme "de bonnes approximations des modèles les plus appropriés basés sur la théorie de la randomisation."

Clarinettiste

Plus tôt, il déclare: "[La] statistique a traditionnellement désigné la théorie de la randomisation comme un domaine de statistiques non paramétriques. La théorie de la randomisation est également d'un intérêt particulier dans la théorie de la conception expérimentale parce que la randomisation a été utilisée pour justifier l'analyse des expériences conçues." Donc, je suppose que ce que je demande vraiment, c'est un livre sur la théorie de la randomisation.

Clarinettiste

Votre question prend une tournure intéressante. Je ne pensais certainement pas à la théorie de la randomisation. Je suppose que cela impliquerait une définition des effets de bloc en termes de membres de la population finie, et peut-être qu'un tel modèle pourrait alors être «dérivé». J'espère que nous verrons une réponse comme celle-ci se concrétiser.

Ben Ogorek

(Références) Comment dériver des modèles de conception expérimentale, au lieu de simplement les mémoriser?

Réponses: