Questions marquées «resampling»

Le rééchantillonnage consiste à prélever un échantillon d'un échantillon. Les utilisations courantes sont le jackknifing (prendre un sous-échantillon, par exemple toutes les valeurs sauf 1) et le bootstrap (échantillonnage avec remplacement). Ces techniques peuvent fournir une estimation robuste d'une distribution d'échantillonnage lorsqu'il serait difficile ou impossible d'en déduire analytiquement.

75
Méthodes de rééchantillonnage / simulation: monte carlo, bootstrapping, jackknifing, validation croisée, tests de randomisation et tests de permutation

J'essaie de comprendre la différence entre différentes méthodes de rééchantillonnage (simulation de Monte Carlo, amorçage paramétrique, amorçage non paramétrique, jackknifing, validation croisée, tests de randomisation et de permutation) et leur mise en œuvre dans mon propre contexte en utilisant...

20
Méthodes de rééchantillonnage du caret

J'utilise la bibliothèque careten R pour tester différentes procédures de modélisation. L' trainControlobjet permet de spécifier une méthode de rééchantillonnage. Les méthodes sont décrites dans la documentation section 2.3 et comprennent: boot, boot632, cv, LOOCV, LGOCV, repeatedcvet oob. Bien que...

12
Comment effectuer l'imputation de valeurs dans un très grand nombre de points de données?

J'ai un très grand ensemble de données et il manque environ 5% de valeurs aléatoires. Ces variables sont corrélées entre elles. L'exemple de jeu de données R suivant n'est qu'un exemple de jouet avec des données corrélées factices. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1,...

11
Coefficient de Gini et limites d'erreur

J'ai une série chronologique de données avec N = 14 comptes à chaque point dans le temps, et je veux calculer le coefficient de Gini et une erreur standard pour cette estimation à chaque point dans le temps. Comme je n'ai que N = 14 comptes à chaque instant, j'ai procédé au calcul de la variance...