En réponse à une question sur la sélection des modèles en présence de multicolinéarité , Frank Harrell a suggéré :
Mettez toutes les variables dans le modèle mais ne testez pas l'effet d'une variable ajustée pour les effets des variables concurrentes ... en compétition les uns contre les autres comme lorsque vous testez des variables individuellement.
Que sont les tests de blocs ? Pouvez-vous donner un exemple de leur application dans r
?
Réponses:
@ mark999 a fourni une excellente réponse. En plus de tester conjointement des termes polynomiaux, vous pouvez tester conjointement ("test de bloc") n'importe quel ensemble de variables. Supposons que vous disposiez d'un modèle avec des variables colinéaires concurrentes: circonférence du triceps, taille, circonférence des hanches, toutes les mesures de la taille du corps. Pour obtenir un test global de la taille du corps, vous pouvez faire
NA
tricep, waist, hip
la source
Le commentaire de Macro est correct, tout comme Andy. Voici un exemple.
Au lieu de considérer les termes
x2
etx2^2
séparément, le "test de bloc" est le test à 2 df qui teste l'hypothèse nulle selon laquelle les coefficients de ces termes sont tous deux nuls (je crois qu'il est plus communément appelé quelque chose comme un "test F linéaire général" ). La valeur de p pour ce test est le 0,0037 donné paranova(ols1)
.Notez que dans le
rms
package, vous devez spécifier lesx2
termes quepol(x2, 2)
pouranova.rms()
savoir qu'ils doivent être testés ensemble.anova.rms()
effectuera des tests similaires pour les variables prédictives qui sont représentées comme des splines cubiques restreintes en utilisant, par exemplercs(x2, 3)
, et pour les variables prédictives catégorielles. Il inclura également des termes d'interaction dans les "morceaux".Si vous vouliez faire un test en bloc pour les variables prédictives «concurrentes» générales, comme mentionné dans la citation, je pense que vous devriez le faire manuellement en ajustant les deux modèles séparément puis en les utilisant
anova(model1, model2)
. [Modifier: c'est incorrect - voir la réponse de Frank Harrell.]la source