Questions marquées «model-selection»

13
Comprendre les critères AIC et Schwarz

Je gère un modèle logistique. L'ensemble de données du modèle réel comporte plus de 100 variables, mais je choisis un ensemble de données de test dans lequel il y a environ 25 variables. Avant cela, j'ai également créé un ensemble de données contenant 8 à 9 variables. On me dit que les valeurs AIC...

13
Comment comparer les modèles sur la base de l'AIC?

Nous avons deux modèles qui utilisent la même méthode pour calculer la vraisemblance logarithmique et l'AIC pour l'un est inférieur à l'autre. Cependant, celui avec l'AIC inférieur est beaucoup plus difficile à interpréter. Nous avons du mal à décider si cela vaut la peine d'introduire la...

13
Que sont les tests de blocs?

En réponse à une question sur la sélection des modèles en présence de multicolinéarité , Frank Harrell a suggéré : Mettez toutes les variables dans le modèle mais ne testez pas l'effet d'une variable ajustée pour les effets des variables concurrentes ... en compétition les uns contre les autres...

12
Différences entre PROC Mixed et lme / lmer en R - degrés de liberté

Remarque: cette question est une rediffusion, car ma question précédente a dû être supprimée pour des raisons juridiques. En comparant PROC MIXED de SAS avec la fonction lmedu nlmepackage dans R, je suis tombé sur des différences assez confuses. Plus précisément, les degrés de liberté dans les...

12
Sélection du modèle PCA avec AIC (ou BIC)

Je souhaite utiliser le critère d'information Akaike (AIC) pour choisir le nombre approprié de facteurs à extraire dans une ACP. Le seul problème est que je ne sais pas comment déterminer le nombre de paramètres. Considérons une matrice X , où N représente le nombre de variables et T le nombre...

12
Bayesian vs MLE, problème de surajustement

Dans le livre de Bishop's PRML, il dit que le sur-ajustement est un problème avec l'estimation de maximum de vraisemblance (MLE), et que le bayésien peut l'éviter. Mais je pense que le sur-ajustement est un problème plus lié à la sélection du modèle, pas à la méthode utilisée pour faire...

12
Test exact de Fisher et distribution hypergéométrique

Je voulais mieux comprendre le test exact du pêcheur, j'ai donc imaginé l'exemple de jouet suivant, où f et m correspond à l'homme et à la femme, et n et y correspond à la "consommation de soda" comme ceci: > soda_gender f m n 0 5 y 5 0 Évidemment, c'est une simplification drastique, mais je ne...