Statistiques et Big Data

18
Comment le cadre bayésien est-il meilleur dans l'interprétation lorsque nous utilisons habituellement des priors non informatifs ou subjectifs?

On fait souvent valoir que le cadre bayésien a un grand avantage dans l'interprétation (sur fréquentiste), car il calcule la probabilité d'un paramètre étant donné les données - au lieu de comme dans le cadre fréquentiste. Jusqu'ici tout va bien.p ( x | θ )p ( θ | x )p(θ|x)p(\theta|x)p ( x | θ...

18
Importance variable de GLMNET

Je cherche à utiliser le lasso comme méthode pour sélectionner des entités et ajuster un modèle prédictif avec une cible binaire. Voici un code avec lequel je jouais pour essayer la méthode avec régression logistique régularisée. Ma question est de savoir si j'obtiens un groupe de variables...

18
Intervalle de confiance étroit - précision plus élevée?

J'ai deux questions sur les intervalles de confiance: Apparemment, un intervalle de confiance étroit implique qu'il y a une moindre chance d'obtenir une observation dans cet intervalle, par conséquent, notre précision est plus élevée. Un intervalle de confiance à 95% est également plus étroit qu'un...

18
Marche aléatoire avec élan

Considérez une marche aléatoire entière commençant à 0 avec les conditions suivantes: La première étape est plus ou moins 1, avec une probabilité égale. Chaque étape future est: 60% susceptibles d'être dans la même direction que l'étape précédente, 40% susceptibles d'être dans la direction opposée...

18
Fonctionnement du test Chi Squared de Pearson

À la suite d'un récent vote à la baisse, j'ai essayé de vérifier ma compréhension du test Pearson Chi Squared. J'utilise généralement la statistique du chi carré (ou la statistique du chi carré réduit) pour ajuster ou vérifier l'ajustement résultant. Dans ce cas, la variance n'est généralement pas...