Je m'intéresse à la prévision Y
et j'étudie deux techniques de mesure X1
et X2
. Il se pourrait, par exemple, que je veuille prédire la saveur d'une banane, soit en mesurant depuis combien de temps elle repose sur la table, soit en mesurant le nombre de taches brunes sur la banane.
Je veux savoir laquelle des techniques de mesure est la meilleure, si je choisis d'en effectuer une seule.
Je peux créer un modèle linéaire dans R:
m1 = lm(Y ~ X1)
m2 = lm(Y ~ X2)
Maintenant, disons que X1
c'est un prédicteur supérieur de la saveur de la banane X2
. Lors du calcul de la des deux modèles, le du modèle m1
est nettement supérieur au modèle m2
. Avant d'écrire un article sur la façon dont la méthode X1
est meilleure que X2
, je veux avoir une sorte d'indication que la différence n'est pas par hasard, peut-être sous la forme d'une valeur de p.
Comment procéder? Comment le faire lorsque j'utilise différentes marques de bananes et passer à un modèle à effet mixte linéaire qui incorpore la marque de banane comme un effet aléatoire?
X1
etX2
serait probablement corrélé, car les taches brunes augmentent probablement avec l'augmentation du temps allongé sur la table.Réponses:
Plus tard
Une chose que je veux ajouter après avoir entendu que vous avez des modèles d'effets mixtes linéaires:A jeC, A ICc et B IC peut encore être utilisé pour comparer les modèles. Voir cet article , par exemple. D'après d'autres questions similaires sur le site, il semble que ce document est crucial.
Réponse originale
Ce que vous voulez essentiellement, c'est comparer deux modèles non imbriqués. Burnham and Anderson Model selection and multimodel inference discuter this and recommend using theA jeC , A jeCc ou B IC etc., car le test traditionnel du rapport de vraisemblance ne s'applique qu'aux modèles imbriqués. Ils déclarent explicitement que les critères théoriques de l’information tels queAIC,AICc,BIC etc. ne sont pas des tests et que le mot «significatif» doit être évité lors de la communication des résultats.
Sur la base de cela et de ces réponses, je recommande ces approches:
pairs(Y~X1+X2, panel = panel.smooth, lwd = 2, cex = 1.5, col = "steelblue", pch=16)
. Vérifiez si les lignes (les lissoirs) sont compatibles avec une relation linéaire. Affinez le modèle si nécessaire.m1
etm2
. Faites quelques vérifications du modèle (résidus, etc.):plot(m1)
etplot(m2)
.R
packagepscl
fournit la fonctionAICc
pour cela:abs(AICc(m1)-AICc(m2))
. Si cette différence absolue est inférieure à 2, les deux modèles sont fondamentalement indiscernables. Sinon, préférez le modèle avec le plus basR
packagelmtest
a les fonctionscoxtest
(test Cox),jtest
( test Davidson-MacKinnon J) etencomptest
(test englobant Davidson & MacKinnon).Quelques réflexions: Si les deux mesures de la banane mesurent vraiment la même chose, elles peuvent toutes deux être également adaptées à la prédiction et il pourrait ne pas y avoir de "meilleur" modèle.
Ce document pourrait également être utile.
En voici un exemple
R
:Les lissoirs confirment les relations linéaires. C'était prévu, bien sûr.
leAICc du premier modèle R2 est beaucoup plus élevé.
m1
est nettement plus faible et laImportant: dans les modèles linéaires de complexité égale et de distribution d'erreur gaussienne ,R2,AIC et BIC devrait donner les mêmes réponses (voir cet article ). Dans les modèles non linéaires , l'utilisation deR2 pour les performances du modèle (qualité de l'ajustement) et la sélection du modèle doivent être évitées: voir cet article et ce document , par exemple.
la source
lmtest
package. Avant de me plonger dans la littérature écrite sur les tests de type cox avec les LME, quelqu'un connaît-il un package R facilement disponible pour le faire?R
paquet qui pourrait faire ça. Peut - être que ce post peut vous donner des conseils supplémentaires.Il y a une bonne réponse du 19ème siècle en risque de négligence. Pour comparer deux ajustements linéaires différents, tracez les données et les lignes ajustées et réfléchissez à ce que vous voyez. Il est fort probable qu'un modèle sera nettement meilleur, et cela ne signifie pas nécessairement plusR2 . Par exemple, il est possible qu'un modèle linéaire soit qualitativement erroné dans l'un ou l'autre cas. Encore mieux, les données et l'ajustement peuvent suggérer un meilleur modèle. Si les deux modèles semblent à peu près bons ou mauvais, c'est une autre réponse.
L'exemple de la banane est vraisemblablement facétieux ici, mais je ne m'attendrais pas du tout à ce que les ajustements en ligne fonctionnent bien ...
La machinerie inférentielle déployée par d'autres en réponse est une chose de beauté intellectuelle, mais parfois vous n'avez pas besoin d'un marteau de pointe pour casser une noix. Parfois, il semble que quiconque publie ce soir-là est plus sombre que le jour aurait toujours quelqu'un demander "Avez-vous testé cela formellement? Quelle est votre valeur P?".
la source
Faites un test de Cox pour les modèles non imbriqués.
(vous trouverez des références à d'autres tests).
Voir aussi ce commentaire et cette question . En particulier, pensez à utiliser AIC / BIC.
la source