Statistiques et Big Data

10
Pourquoi les gens aiment-ils les données fluides?

Je dois utiliser le noyau exponentiel carré (SE) pour la régression du processus gaussien. Les avantages de ce noyau sont: 1) simple: seulement 3 hyperparamètres; 2) lisse: ce noyau est gaussien. Pourquoi les gens aiment-ils tant la «douceur»? Je sais que le noyau gaussien est infiniment...

10
Quelle est l'estimation du maximum de vraisemblance de la covariance des données normales bivariées lorsque la moyenne et la variance sont connues?

Supposons que nous ayons un échantillon aléatoire d'une distribution normale bivariée qui a des zéros comme moyennes et des uns comme des variances, donc le seul paramètre inconnu est la covariance. Quel est le MLE de la covariance? Je sais que cela devrait être quelque chose comme mais comment...

10
Comment choisir la formation, la validation croisée et la taille des ensembles de tests pour les données de petite taille d'échantillon?

Supposons que j'ai un petit échantillon, par exemple N = 100 et deux classes. Comment dois-je choisir la formation, la validation croisée et la taille des ensembles de tests pour l'apprentissage automatique? Je choisirais intuitivement Taille de l'ensemble d'entraînement: 50 Ensemble de validation...

10
RMSE normalisé

J'ai plusieurs séries chronologiques dans un VAR (1) et, comme certaines d'entre elles n'ont pas la même unité de mesure, je voudrais estimer le RMSE en pourcentage. Je sais que cela pourrait se faire de plusieurs manières (voir ci-dessous) mais je ne sais pas précisément quelle est celle qui...

10
lmer avec multiplier les données imputées

Comment puis-je obtenir des effets aléatoires groupés pour lmer après une imputation multiple? J'utilise des souris pour imputer plusieurs trames de données. Et lme4 pour un modèle mixte avec interception aléatoire et pente aléatoire. La mise en commun de lmer se passe bien, sauf qu'elle ne...