Comme la modélisation de régression est souvent plus «artistique» que scientifique, je me retrouve souvent à tester de nombreuses itérations d'une structure de régression. Quels sont les moyens efficaces de résumer les informations de ces multiples exécutions de modèle pour essayer de trouver le "meilleur" modèle? Une approche que j'ai utilisée consiste à mettre tous les modèles dans une liste et à parcourir summary()
cette liste, mais j'imagine qu'il existe des moyens plus efficaces de comparer?
Exemple de code et modèles:
ctl <- c(4.17,5.58,5.18,6.11,4.50,4.61,5.17,4.53,5.33,5.14)
trt <- c(4.81,4.17,4.41,3.59,5.87,3.83,6.03,4.89,4.32,4.69)
group <- gl(2,10,20, labels=c("Ctl","Trt"))
weight <- c(ctl, trt)
lm1 <- lm(weight ~ group)
lm2 <- lm(weight ~ group - 1)
lm3 <- lm(log(weight) ~ group - 1)
#Draw comparisions between models 1 - 3?
models <- list(lm1, lm2, lm3)
lapply(models, summary)
r
regression
Chasse
la source
la source
Réponses:
Tracez-les!
http://svn.cluelessresearch.com/tables2graphs/longley.png
Ou, si vous le devez, utilisez des tables: le package apsrtable ou la
mtable
fonction dans le package memisc .En utilisant
mtable
la source
grid
, notlattice
:)memisc
auparavant, ressemble à un paquet très pratique à avoir dans son carquois!Ce qui suit ne répond pas exactement à la question. Cela peut cependant vous donner quelques idées. C'est quelque chose que j'ai récemment fait pour évaluer l'ajustement de plusieurs modèles de régression en utilisant une à quatre variables indépendantes (la variable dépendante était dans la première colonne du cadre de données df1).
Le contenu de as.character (liste de formulaires) a été
Ensuite, j'ai rassemblé quelques indices utiles
La trame de données finale était
Enfin, un tracé Cp (en utilisant la bibliothèque wle)
la source