J'ai une question de base concernant les approches de la moyenne des modèles à l'aide de critères informatiques pour pondérer les modèles au sein d'un ensemble candidat.
La plupart des sources que j'ai lues sur la moyenne du modèle préconisent de faire la moyenne des estimations des coefficients des paramètres sur la base des poids du modèle (soit en utilisant une méthode «moyenne naturelle», soit une méthode «moyenne zéro»). Cependant, j'avais l'impression que la moyenne et la pondération des prévisions de chaque modèle , plutôt que les estimations des coefficients des paramètres, basées sur les poids du modèle, étaient une approche plus simple et justifiée, en particulier si l'on comparait des modèles avec des variables prédictives non imbriquées.
Existe-t-il des indications claires sur l'approche de la moyenne du modèle la mieux justifiée (moyenne des estimations des paramètres pondérés par rapport aux prévisions pondérées)? De plus, y a-t-il d'autres complications avec la moyenne du modèle des estimations de coefficient dans le cas des modèles mixtes?
la source
Réponses:
Dans les modèles linéaires, la moyenne des coefficients vous donnera les mêmes valeurs prédites que les valeurs prédites de la moyenne des prédictions, mais transmet plus d'informations. De nombreuses expositions traitent de modèles linéaires et donc de la moyenne des coefficients.
Vous pouvez vérifier l'équivalence avec un peu d'algèbre linéaire. Supposons que vous ayez observations et prédicteurs. Vous regroupez ce dernier dans la matrice . Vous disposez également de modèles, chacun attribuant une estimation de coefficient aux prédicteurs. Empilez ces estimations de coefficient dans la matrice . La moyenne signifie que vous attribuez des poids à chaque modèle (les poids sont généralement non négatifs et un). Mettez ces poids dans le vecteur de longueur .T N T×N X M βm N N×M β wm m w M
Les valeurs prévues pour chaque modèle sont fournies par , ou, dans la notation empilée valeurs prédites de la moyenne des prévisions sont données par Lorsque vous effectuez la moyenne sur à la place, vous calculez Et les valeurs prédites à partir des coefficients de moyenne sont données pary^m=Xβm
Dans les modèles non linéaires, l'équivalence ne tient généralement plus et là, il est en effet logique de faire une moyenne entre les prédictions. La vaste littérature sur la moyenne des prévisions (combinaisons de prévisions) est par exemple résumée ici .
la source