Statistiques et Big Data

32
ANOVA sur des données binomiales

J'analyse un ensemble de données expérimentales. Les données consistent en un vecteur apparié du type de traitement et un résultat binomial: Treatment Outcome A 1 B 0 C 0 D 1 A 0 ... Dans la colonne des résultats, 1 indique un succès et 0, un échec. Je voudrais savoir si le traitement varie de...

32
Quel est le concept statistique le plus difficile à saisir?

C'est une question similaire à celle ici , mais suffisamment différente, je pense, pour que cela vaille la peine d'être posée. Je pensais mettre comme point de départ ce que je pense être l’un des plus difficiles à comprendre. Le mien est la différence entre probabilité et fréquence . L'une se...

32
Comment R gère-t-il les valeurs manquantes dans lm?

Je voudrais régresser un vecteur B par rapport à chacune des colonnes d'une matrice A. C'est trivial s'il n'y a pas de données manquantes, mais si la matrice A contient des valeurs manquantes, ma régression par rapport à A est contrainte d'inclure uniquement les lignes où tout des valeurs sont...

32
Variance du produit des variables dépendantes

Quelle est la formule de variance du produit des variables dépendantes? Dans le cas de variables indépendantes, la formule est simple: var(XY)=E(X2Y2)−E(XY)2=var(X)var(Y)+var(X)E(Y)2+var(Y)E(X)2var(XY)=E(X2Y2)−E(XY)2=var(X)var(Y)+var(X)E(Y)2+var(Y)E(X)2 {\rm var}(XY) = E(X^{2}Y^{2}) - E(XY)^{2} =...

32
Existe-t-il un projet Euler-like pour l'apprentissage automatique?

J'ai trouvé que Project Euler http://projecteuler.net/ était incroyablement utile pour apprendre les langages de programmation. Existe-t-il un site similaire pour l'apprentissage automatique? J'ai vu http://www.kaggle.com/ , mais il n'est pas aussi accessible aux débutants que Project...

32
Pourquoi R renvoie-t-il NA sous forme de coefficient lm ()?

J'adapte un lm()modèle à un ensemble de données comprenant des indicateurs pour le trimestre financier (T1, T2, T3, Q4 par défaut). En utilisant lm(Y~., data = data) je reçois un NAcomme coefficient pour Q3, et un avertissement indiquant qu’une variable a été exclue à cause de singularités. Dois-je...