Statistiques et Big Data

10
Répartir les distributions

J'ai plusieurs distributions (10 distributions dans la figure ci-dessous). En fait ce sont des histogrammes: il y a 70 valeurs sur l'axe des x qui sont les tailles de certaines particules dans une solution et pour chaque valeur de x la valeur correspondante de y est la proportion de particules dont...

10
Retard sur une série chronologique groupée

J'ai quelques dizaines de milliers d'observations qui sont dans une série chronologique mais regroupées par emplacements. Par exemple: location date observationA observationB --------------------------------------- A 1-2010 22 12 A 2-2010 26 15 A 3-2010 45 16 A 4-2010 46 27 B 1-2010 167 48 B 2-2010...

10
R régression linéaire variable catégorielle valeur «cachée»

Ceci est juste un exemple que j'ai rencontré plusieurs fois, donc je n'ai pas d'échantillons de données. Exécution d'un modèle de régression linéaire dans R: a.lm = lm(Y ~ x1 + x2) x1est une variable continue. x2est catégorique et a trois valeurs, par exemple "Low", "Medium" et "High". Cependant,...

10
Comment comparer l'exactitude de deux modèles différents en utilisant la signification statistique

Je travaille sur la prédiction de séries chronologiques. J'ai deux ensembles de données et . J'ai trois modèles de prédiction: . Tous ces modèles sont entraînés à l'aide d'échantillons dans l'ensemble de données , et leurs performances sont mesurées à l'aide des échantillons dans l'ensemble de...

10
Susciter des prieurs… avec de l'argent!

Supposons que j'ai « experts », dont je voudrais obtenir une distribution préalable sur une variable . Je voudrais les motiver avec de l'argent réel . L'idée est de susciter les priors, d'observer réalisations de la variable aléatoire , puis de répartir une certaine «bourse» prédéterminée parmi les...

10
Quartiles dans Excel

Je m'intéresse à la définition de quartile qui est habituellement utilisée lorsque vous êtes dans les statistiques de base. J'ai un livre de type Stat 101 et il donne juste une définition intuitive. "Environ un quart des données se situe dans ou en dessous du premier quartile ..." Mais, il donne un...

10
Comment puis-je calculer la statistique de test Pearson pour le manque d'ajustement sur un modèle de régression logistique dans R?

Le rapport de vraisemblance (aka déviance) statistique et test de manque d'ajustement (ou qualité d'ajustement) est assez simple à obtenir pour un modèle de régression logistique (ajustement à l'aide de la fonction) dans R. Cependant, il peut être il est facile de faire en sorte que le nombre de...