Statistiques et Big Data

9
R: Anova et régression linéaire

Je suis nouveau dans les statistiques et j'essaie de comprendre la différence entre l'ANOVA et la régression linéaire. J'utilise R pour explorer cela. J'ai lu divers articles sur les raisons pour lesquelles l'ANOVA et la régression sont différentes mais toujours les mêmes et comment elles peuvent...

9
Couplage des informations de séries chronologiques à partir de sources avec plusieurs résolutions / échelles spatiales

J'ai de nombreuses images raster satellite disponibles à partir de différents capteurs. De ceux-ci, les plus grossiers ont une résolution temporelle très abondante. Les rasters à résolution moyenne ont tendance à avoir moins de dates d'acquisition, mais un certain degré d'informations est toujours...

9
Attente de la somme des nombres K sans remplacement

Étant donné nombres, où la valeur de chaque nombre est différente, notée , et la probabilité de sélectionner chaque nombre est , respectivement.nnnv1,v2,...,vnv1,v2,...,vnv_1, v_2, ..., v_np1,p2,...,pnp1,p2,...,pnp_1, p_2, ..., p_n Maintenant, si je sélectionne nombres basés sur les probabilités...

9
Le rééchantillonnage bootstrap peut-il être utilisé pour calculer un intervalle de confiance pour la variance d'un ensemble de données?

Je sais que si vous rééchantillonnez à plusieurs reprises à partir d'un ensemble de données et calculez la moyenne à chaque fois, ces moyennes suivront une distribution normale (par le CLT). Ainsi, vous pouvez calculer un intervalle de confiance sur la moyenne de l'ensemble de données sans faire...

9
Essayer de comprendre le processus gaussien

Je lis le livre GPML et au chapitre 2 (page 15) , il explique comment effectuer une régression en utilisant le processus gaussien (GP), mais j'ai du mal à comprendre comment cela fonctionne. Dans l'inférence bayésienne pour les modèles paramétriques, nous choisissons d'abord un a priori sur les...

9
La régression linéaire ne correspond pas bien

Je fais une régression linéaire en utilisant la fonction R lm: x = log(errors) plot(x,y) lm.result = lm(formula = y ~ x) abline(lm.result, col="blue") # showing the "fit" in blue mais ça ne va pas bien. Malheureusement, je ne peux pas comprendre le manuel. Quelqu'un peut-il m'orienter dans la bonne...