Je voudrais comparer deux modèles de régression linéaire qui représentent les taux de dégradation d'un ARNm dans le temps dans deux conditions différentes. Les données de chaque modèle ont été collectées indépendamment.
Voici l'ensemble de données.
Journal de temps (heures) (traitement A) journal (traitement B) 0 2,02 1,97 0 2,04 2,06 0 1,93 1,96 2 2,02 1,91 2 2,00 1,95 2 2,07 1,82 4 1,96 1,97 4 2,02 1,99 4 2,02 1,99 6 1,94 1,90 6 1,94 1,97 6 1,86 1,88 8 1,93 1,97 8 2,12 1,99 8 2,06 1,93 12 1,71 1,70 12 1,96 1,73 12 1,71 1,76 24 1,70 1,46 24 1,83 1,41 24 1,62 1,42
Ce sont mes modèles:
Exp1.A.lm<-lm(Exp1$Time~Exp1$(Treatment A))
Exp1.B.lm<-lm(Exp1$Time~Exp1$(Treatment B))
Appel: lm (formule = Exp1 $ Time ~ Exp1 $ (Traitement A)) Résidus: Min 1Q Médian 3Q Max -6.8950 -1.2322 0.2862 1.2494 5.2494 Coefficients: Estimer Std. Erreur t valeur Pr (> | t |) (Interception) 74,68 6,27 11,91 2,94e-10 *** Exp1 $ (Traitement A) -36,14 3,38 -10,69 1,77e-09 *** --- Signif. codes: 0 '***' 0,001 '**' 0,01 '*' 0,05 '.' 0,1 '' 1 Erreur standard résiduelle: 2,97 sur 19 degrés de liberté Multiple R-carré: 0,8575, R-carré ajusté: 0,85 Statistique F: 114,3 sur 1 et 19 DF, valeur p: 1,772e-09 Appel: lm (formule = Exp1 $ Time ~ Exp1 $ (Traitement B)) Résidus: Min 1Q Médian 3Q Max -7,861 -3,278 -1,444 3,222 11,972 Coefficients: Estimer Std. Erreur t valeur Pr (> | t |) (Interception) 88,281 16,114 5,478 2,76e-05 *** Exp1 $ (Traitement B) -41.668 8.343 -4.994 8.05e-05 *** --- Signif. codes: 0 '***' 0,001 '**' 0,01 '*' 0,05 '.' 0,1 '' 1 Erreur standard résiduelle: 5.173 sur 19 degrés de liberté Multiple R-carré: 0,5676, R-carré ajusté: 0,5449 Statistique F: 24,94 sur 1 et 19 DF, valeur p: 8,052e-05
Pour comparer ces deux modèles, j'ai utilisé ce code suivant.
anova(Exp1.A.lm,Exp1.B.lm)
Tableau d'analyse de la variance Modèle 1: Exp1 $ Time ~ Exp1 $ Exp1 $ (Traitement A) Modèle 2: Exp1 $ Time ~ Exp1 $ Exp1 $ (Traitement B) Res.Df RSS Df Somme de Sq F Pr (> F) 1 19 167,60 2 19 508,48 0 -340,88
Ma question est pourquoi l'analyse ANOVA ne montre pas de statistiques F et de p.val. Mes excuses si c'est une question naïve.
Sur la base de différentes pentes, le taux de dégradation est différent dans ces deux modèles, mais j'aimerais savoir à quel point cette différence est statistiquement significative. J'espère que cela a du sens.
Réponses:
Si vous configurez les données dans une longue colonne avec A et B comme nouvelle colonne, vous pouvez alors exécuter votre modèle de régression en tant que GLM avec une variable de temps continue et une variable "d'expérience" nominale (A, B). La sortie de l'ANOVA vous donnera la signification de la différence entre les paramètres. "intercepter" est l'ordonnée à l'origine commune et le facteur "expérience" reflétera les différences entre les interceptions (en fait les moyennes globales) entre les expériences. le facteur "temps" sera la pente commune, et l'interaction est la différence entre les expériences en ce qui concerne à la pente.
Je dois admettre que je triche (?) Et exécute les modèles séparément d'abord pour obtenir les deux ensembles de paramètres et leurs erreurs, puis exécute le modèle combiné pour acquérir les différences entre les traitements (dans votre cas A et B) ...
la source
L'analyse ANOVA ne montre pas de statistiques F et une valeur p puisque les deux modèles ont les mêmes degrés de liberté résiduels (soit 19) et si vous prenez la différence, ce serait zéro! Il doit y avoir au moins un degré de liberté après avoir pris la différence pour effectuer le test F.
la source