Statistiques et Big Data

9
MCMC pour gérer les problèmes de vraisemblance plate

J'ai une probabilité assez faible conduisant l'échantillonneur Metropolis-Hastings à se déplacer dans l'espace des paramètres de manière très irrégulière, c'est-à-dire qu'aucune convergence ne peut être atteinte quels que soient les paramètres de distribution de la proposition (dans mon cas, il est...

9
Des transformations de données sur des données non normales sont-elles nécessaires pour une analyse factorielle exploratoire lors de l'utilisation de la méthode d'extraction factorisée par axe principal?

Je développe un questionnaire pour mesurer quatre facteurs qui constituent la spiritualité, et je voudrais poser la question suivante: Des transformations de données sur des données non normales sont-elles nécessaires pour une analyse factorielle exploratoire lors de l'utilisation de la méthode...

9
Comment comparer les événements observés aux événements attendus?

Supposons que j'ai un échantillon de fréquences de 4 événements possibles: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 et j'ai les probabilités attendues que mes événements se produisent: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 Avec la somme des fréquences observées de mes quatre événements (18), je peux calculer...

9
Distributions hyperprior pour les paramètres (matrice d'échelle et degrés de liberté) d'un wishart avant une matrice de covariance inverse

J'estime plusieurs matrices de covariance inverse d'un ensemble de mesures à travers différentes sous-populations en utilisant un wishart prior dans jags / rjags / R. Au lieu de spécifier une matrice d'échelle et des degrés de liberté sur la matrice de covariance inverse antérieure (la distribution...

9
Comment utiliser R gbm avec distribution = “adaboost”?

La documentation indique que R gbm avec distribution = "adaboost" peut être utilisé pour un problème de classification 0-1. Considérez le fragment de code suivant: gbm_algorithm <- gbm(y ~ ., data = train_dataset, distribution = "adaboost", n.trees = 5000) gbm_predicted <-...