Questions marquées «model-selection»

12
Sélection du modèle PCA avec AIC (ou BIC)

Je souhaite utiliser le critère d'information Akaike (AIC) pour choisir le nombre approprié de facteurs à extraire dans une ACP. Le seul problème est que je ne sais pas comment déterminer le nombre de paramètres. Considérons une matrice X , où N représente le nombre de variables et T le nombre...

12
Bayesian vs MLE, problème de surajustement

Dans le livre de Bishop's PRML, il dit que le sur-ajustement est un problème avec l'estimation de maximum de vraisemblance (MLE), et que le bayésien peut l'éviter. Mais je pense que le sur-ajustement est un problème plus lié à la sélection du modèle, pas à la méthode utilisée pour faire...

12
Test exact de Fisher et distribution hypergéométrique

Je voulais mieux comprendre le test exact du pêcheur, j'ai donc imaginé l'exemple de jouet suivant, où f et m correspond à l'homme et à la femme, et n et y correspond à la "consommation de soda" comme ceci: > soda_gender f m n 0 5 y 5 0 Évidemment, c'est une simplification drastique, mais je ne...

11
Sélection du modèle ABC

Il a été démontré que le choix du modèle ABC utilisant des facteurs de Bayes n'est pas recommandé en raison de la présence d'une erreur provenant de l'utilisation de statistiques sommaires. La conclusion de cet article repose sur l'étude du comportement d'une méthode populaire d'approximation du...

11
Sélection du modèle bayésien dans PyMC3

J'utilise PyMC3 pour exécuter des modèles bayésiens sur mes données. Je suis nouveau dans la modélisation bayésienne mais selon certains articles de blogs , Wikipedia et QA de ce site, il semble que ce soit une approche valable pour utiliser le facteur Bayes et le critère BIC pour pouvoir choisir...

11
Comment sélectionner le meilleur ajustement sans données sur-ajustées? Modélisation d'une distribution bimodale avec N fonctions normales, etc.

J'ai une distribution de valeurs évidemment bimodale, que je cherche à adapter. Les données peuvent être adaptées à 2 fonctions normales (bimodales) ou à 3 fonctions normales. De plus, il existe une raison physique plausible pour ajuster les données avec 3. Plus il y a de paramètres introduits,...

10
Questions sur la spécification de modèles mixtes linéaires dans R pour les données de mesures répétées avec une structure d'imbrication supplémentaire

Structure de données > str(data) 'data.frame': 6138 obs. of 10 variables: $ RT : int 484 391 422 516 563 531 406 500 516 578 ... $ ASCORE : num 5.1 4 3.8 2.6 2.7 6.5 4.9 2.9 2.6 7.2 ... $ HSCORE : num 6 2.1 7.9 1 6.9 8.9 8.2 3.6 1.7 8.6 ... $ MVMNT : Factor w/ 2 levels "_Withd","Appr": 2 2 1 1 2...

10
Facteurs de Bayes avec des antérieurs incorrects

J'ai une question concernant la comparaison des modèles à l'aide des facteurs Bayes. Dans de nombreux cas, les statisticiens sont intéressés à utiliser une approche bayésienne avec des a priori impropres (par exemple certains a priori de Jeffreys et a priori de référence). Ma question est, dans les...

10
Supériorité de LASSO sur la sélection vers l'avant / l'élimination vers l'arrière en termes d'erreur de prédiction de validation croisée du modèle

J'ai obtenu trois modèles réduits à partir d'un modèle complet original en utilisant sélection avant élimination en arrière Technique de pénalisation L1 (LASSO) Pour les modèles obtenus en utilisant la sélection vers l'avant / l'élimination vers l'arrière, j'ai obtenu l'estimation de validation...