De manière asymptotique, la minimisation de l'AIC est équivalente à la minimisation de la MSE de validation croisée avec sortie pour les données transversales [ 1 ]. Alors, quand nous avons l'AIC, pourquoi utilise-t-on du tout la méthode de division des données en ensembles de formation, de validation et de test pour mesurer les propriétés prédictives des modèles? Quels sont précisément les avantages de cette pratique?
Je peux penser à une raison: si l'on veut évaluer les performances prédictives des modèles, l'analyse hors échantillon est utile. Mais bien que l'AIC ne soit pas une mesure de la précision des prévisions , on a généralement une bonne idée si un modèle atteint son potentiel maximum (pour les données fournies) en termes de capacité à prédire.
la source
Réponses:
Dans la pratique, j'utilise toujours la validation croisée ou une simple répartition train-test plutôt que l'AIC (ou BIC). Je ne connais pas trop la théorie de l'AIC, mais deux préoccupations principales me conduisent à préférer des estimations plus directes de la précision prédictive:
Le nombre lui-même ne vous dit pas grand-chose sur la précision d'un modèle. L'AIC peut fournir des preuves quant au modèle le plus précis parmi plusieurs, mais il ne vous indique pas la précision du modèle en unités du DV. Je m'intéresse presque toujours à des estimations de précision concrètes de ce type, car elles me disent à quel point un modèle est utile en termes absolus, et combien il est plus précis qu'un modèle de comparaison.
AIC, comme BIC, a besoin pour chaque modèle d'un nombre de paramètres ou d'une autre valeur qui mesure la complexité du modèle. Il n'est pas clair ce que vous devriez faire pour cela dans le cas de méthodes prédictives moins traditionnelles comme la classification du plus proche voisin, les forêts aléatoires ou la nouvelle méthode farfelue de l'ensemble que vous avez gribouillée sur une serviette cocktail au milieu de la cintreuse du mois dernier. En revanche, des estimations de précision peuvent être produites pour tout modèle prédictif, et de la même manière.
la source