Statistiques et Big Data

10
Quelles autres transformations de normalisation sont couramment utilisées au-delà des transformations courantes comme la racine carrée, le log, etc.?

Dans l'analyse des résultats aux tests (par exemple, en éducation ou en psychologie), les techniques d'analyse courantes supposent souvent que les données sont normalement distribuées. Cependant, peut-être plus souvent qu'autrement, les scores ont tendance à s'écarter parfois sauvagement de la...

10
Révolutions statistiques depuis 50 ans? [fermé]

Dans l'état actuel des choses, cette question ne convient pas à notre format de questions / réponses. Nous nous attendons à ce que les réponses soient étayées par des faits, des références ou une expertise, mais cette question suscitera probablement un débat, des arguments, des sondages ou une...

10
Sortie du modèle logistique en R

J'essaie d'interpréter le type de modèle logistique suivant: mdl <- glm(c(suc,fail) ~ fac1 + fac2, data=df, family=binomial) Est la sortie des predict(mdl)chances de réussite attendues pour chaque point de données? Existe-t-il un moyen simple de tabuler les cotes pour chaque niveau de facteur du...

10
Distribution asymptotique des multinomiaux

Je recherche la distribution limite de la distribution multinomiale sur les résultats d. IE, la distribution des éléments suivants limn → ∞n- 12Xnlimn→∞n−12Xn\lim_{n\to \infty} n^{-\frac{1}{2}} \mathbf{X_n} Où XnXn\mathbf{X_n} est une variable aléatoire de valeur vectorielle de densité Fn( x...

10
Quantifier le tracé QQ

Le qq-plot peut être utilisé pour visualiser la similitude de deux distributions (par exemple, visualiser la similitude d'une distribution à une distribution normale, mais aussi pour comparer deux distributions de données de bibliothèque). Existe-t-il des statistiques qui génèrent une mesure...

10
Omega au carré pour la mesure de l'effet dans R?

Le livre de statistiques que je lis recommande l'oméga carré pour mesurer les effets de mes expériences. J'ai déjà prouvé en utilisant un plan de parcelle divisé (mélange de plans intra-sujets et inter-sujets) que mes facteurs intra-sujets sont statistiquement significatifs avec p <0,001 et F =...

10
Comparaison longitudinale de deux distributions

J'ai les résultats d'un test sanguin administré à 2500 personnes quatre fois à six mois d'intervalle. Les résultats consistent principalement en deux mesures de la réponse immunitaire - une en présence de certains antigènes de la tuberculose, une en l'absence. Actuellement, chaque test est évalué...