Signification de «conception» dans la matrice de conception?

13

En régression linéaire, Y=Xβ , pourquoi est-il Xappelé matrice de conception? peut-il être conçu ou construit arbitrairement dans une certaine mesure comme dans l'art?X

Tim
la source
3
L'origine du terme est assez ancienne, et je pense que cela remonte aux origines des statistiques inférentielles dans l'analyse des expériences; en particulier, je pense que cela faisait référence à la façon dont la matrice X se rapportait à la conception expérimentale réelle (les paramètres spécifiques des valeurs x ). Si je peux trouver une référence spécifique, je posterai une réponse.
Glen_b -Reinstate Monica
@Glen_b: Merci! Le «design» a-t-il quelque chose à voir avec le choix d'une transformation sur la variable d'entrée, de sorte que la variable de sortie soit également linéaire dans la variable d'entrée transformée? Par exemple, la matrice de conception dans la régression polynomiale?
Tim
2
Lorsque vous créez une expérience que vous spécifiez les valeurs de . X
whuber

Réponses:

15

Pour donner un exemple conforme à la réponse de @ neverKnowsBest, considérons que dans une expérience factorielle il y a 3 facteurs, chacun traité comme une variable catégorielle à 2 niveaux, et chaque combinaison possible des niveaux de facteur est testée dans chaque réplication. Si l'expérience n'était administrée qu'une seule fois (pas de réplication), cette conception nécessiterait 2 3 = 8 analyses. Les exécutions peuvent être décrites par la matrice 8x3 suivante: [ 0 0 0 1 0 0 0 1 0 1 1 0 0 0 1 1 0 1 0 1 1 12323=8 où les lignes représentent les séries et les colonnes représentent les niveaux des facteurs: [ A B C ]. (La première colonne représente le niveau du facteur A, la deuxième colonne B et la troisième colonne C). C'est ce qu'on appelle lamatrice de conception,car elle décrit la conception de l'expérience. La première analyse est collectée au niveau «faible» de tous les facteurs, la deuxième analyse est collectée au niveau «élevé» du facteur A et aux niveaux «faibles» des facteurs B et C, etc.

[000100010110001101011111]
[ABC].

[1000111011000011101001011110100010011001110101001011001011111111]
[IABCABACBCABC].

Citations

Montgomery, D. (2009). Conception et analyse d'expériences, 7e édition. John Wiley & Sons Inc.

tjnel
la source
9

XXXy=Xβ

La conception des expériences se concentre sur la façon de construire la matrice de conception et la matrice de modèle, car cela se produit avant la collecte des données. Si les données sont déjà collectées, la conception est figée mais vous pouvez toujours changer la matrice du modèle. Parfois, une expérience conçue aura dans la matrice de conception certaines colonnes fixes appelées covariables qui ne peuvent pas contrôler mais que vous pouvez observer.

Certaines choses peuvent se produire en fonction de votre choix de modèle et de conception ... certains paramètres peuvent devenir difficiles à estimer (des variances plus importantes de l'estimateur) ou vous ne pourrez peut-être pas du tout estimer certains paramètres. Je dirais que décider d'un modèle approprié comporte certains éléments artistiques, et il y a certainement un art à concevoir des expériences.

neverKnowsBest
la source
2
Ceci est très utile mais voici une note de bas de page sur la «covariable». Certaines personnes utilisent ce terme beaucoup plus largement pour tout type de prédicteur ou de variable indépendante. (De nombreux autres synonymes existent naturellement.)
Nick Cox
(+1) Très bien pour votre première contribution - bienvenue sur notre site!
whuber
2

X

X peut-il être conçu ou construit arbitrairement dans une certaine mesure comme dans l'art?

Fondamentalement, cette question se résume à «pouvez-vous construire un modèle formé à partir de données manufacturées» auquel la réponse est évidemment oui. Par exemple, voici une façon de construire une matrice de conception arbitraire (vecteur de conception, vraiment) qui donnera un modèle avec une pente et une interception prédéfinies:

design_mat=function(b, a){
  X = runif(100)
  Y = a*X + b
  data.frame(X,Y)
}

df = design_mat(-5, 12.3)

(lm(Y~X, data=df))

Call:
lm(formula = Y ~ X, data = df)

Coefficients:
(Intercept)            X  
       -5.0         12.3  

X=Yba

David Marx
la source