Variation technique par rapport au signal réel

8

Je teste la différence dans un résultat continu sous trois conditions différentes.

Sous condition, l'IA mesure le résultat. Je le fais deux fois pour le même échantillon. Des exemples de valeurs pourraient être 2.2, 2.1. Ce sont des répliques "techniques" qui proviennent de la même source biologique

Je fais de même pour quatre répétitions "biologiques" de la condition A:

A1, measure 1: 2.2
A1, measure 2: 2.1
A2, measure 1: 2.0
A2, measure 2: 2.1
A3, measure 1: 1.9
A3, measure 2: 1.8
A4, measure 1: 1.5
A4, measure 2: 1.6

J'ai également les conditions B, C et D, avec deux répétitions "techniques" dans chacune des quatre répétitions "biologiques".

Comment tester le test des différences moyennes (ANOVA) qui tient le mieux compte de la variation technique et biologique? Je ne voudrais pas adapter un modèle comptant chaque mesure comme une observation distincte, car chaque paire provient du même échantillon biologique. Je suppose qu'il doit y avoir un meilleur moyen que de simplement faire la moyenne sur les paires.

Bonus: comment faites-vous cela dans R?

En supposant que j'ai des données qui ressemblent à ceci:

> data
   condition sample measurement outcome
1          A      1           1     2.2
2          A      1           2     2.1
3          A      2           1     2.0
4          A      2           2     2.1
5          A      3           1     1.9
6          A      3           2     1.8
7          A      4           1     1.5
8          A      4           2     1.6
9          B      1           1     1.7
10         B      1           2     1.6
11         B      2           1     1.5
12         B      2           2     1.6
13         B      3           1     1.4
14         B      3           2     1.3
15         B      4           1     1.0
16         B      4           2     1.1
17         C      1           1     2.4
18         C      1           2     2.3
19         C      2           1     2.2
20         C      2           2     2.3
21         C      3           1     2.1
22         C      3           2     2.0
23         C      4           1     1.7
24         C      4           2     1.8

Je ne voudrais probablement pas faire quelque chose comme ça:

summary(lm(outcome~condition, data=data))

Merci d'avance.

Stephen Turner
la source

Réponses:

1

Le problème est que vous avez différentes sources possibles de hasard. Caractère aléatoire individuel (le terme d'erreur normal dans une régression linéaire); variation entre vos deux mesures dans chaque cas; et la variation des unités particulières que vous avez échantillonnées. Je pense que tu veux probablement quelque chose comme

model <- aov(outcome ~ condition + Error(samp + measurement), data=mydata)
summary(model)

J'espère que cela pourra aider.

Peter Ellis
la source