Statistiques et Big Data

13
Package GBM vs Caret utilisant GBM

J'ai ajusté le modèle à l'aide caret, mais j'ai ensuite réexécuté le modèle à l'aide du gbmpackage. Je crois comprendre que le caretpackage utilise gbmet que la sortie doit être la même. Cependant, un simple test rapide utilisant data(iris)montre une différence dans le modèle d'environ 5% en...

13
Pourquoi étudier la régression linéaire?

Étant donné deux variables aléatoires et nous pouvons calculer leur "coefficient de corrélation" et former la ligne de meilleur ajustement entre ces deux variables aléatoires. Ma question est pourquoi?ξξ\xiηη\etaccc 1) Il existe des variables aléatoires, et qui dépendent de la pire façon possible,...

13
Comment comparer les modèles sur la base de l'AIC?

Nous avons deux modèles qui utilisent la même méthode pour calculer la vraisemblance logarithmique et l'AIC pour l'un est inférieur à l'autre. Cependant, celui avec l'AIC inférieur est beaucoup plus difficile à interpréter. Nous avons du mal à décider si cela vaut la peine d'introduire la...

13
Faire MCMC: utiliser jags / stan ou l'implémenter moi-même

Je suis nouveau dans la recherche sur les statistiques bayésiennes. J'ai entendu des chercheurs dire que les chercheurs bayésiens mettaient mieux en œuvre MCMC par eux-mêmes plutôt que d'utiliser des outils comme JAGS / Stan. Puis-je demander quel est l'avantage d'implémenter l'algorithme MCMC par...

13
Pourquoi , mais ?

Sur cette page centrale AP Variables aléatoires vs Variables algébriques , l'auteur, Peter Flanagan-Hyde établit une distinction entre les variables algébriques et aléatoires. Il dit en partie x+x=2xx+x=2xx + x = 2x , mais X+X≠2XX+X≠2XX + X \neq 2X - en fait c'est le sous-titre de l'article. Quelle...