Statistiques et Big Data

12
Analyse des coefficients de régression logistique

Voici une liste de coefficients de régression logistique (le premier est une interception) -1059.61966694592 -1.23890500515482 -8.57185269220438 -7.50413155570413 0 1.03152408392552 1.19874787949191 -4.88083274930613 -5.77172565873336 -1.00610998453393 Je trouve bizarre à quel point l'ordonnée à...

12
Modèle bayésien hiérarchique (?)

Veuillez m'excuser d'avoir massacré le jargon statistique :) J'ai trouvé ici quelques questions concernant la publicité et les taux de clics. Mais aucun d'eux ne m'a beaucoup aidé dans ma compréhension de ma situation hiérarchique. Il y a une question connexe. Ces représentations équivalentes du...

12
Quand utiliser le bootstrap vs la technique bayésienne?

J'ai un problème d'analyse décisionnelle assez compliqué impliquant des tests de fiabilité et l'approche logique (pour moi) semble impliquer l'utilisation de MCMC pour soutenir une analyse bayésienne. Cependant, il a été suggéré qu'il serait plus approprié d'utiliser une approche d'amorçage....

12
Estimation de la distribution à partir des données

J'ai un échantillon de données générées Rpar rnorm(50,0,1), donc les données prennent évidemment une distribution normale. Cependant, Rne "connaît" pas ces informations de distribution sur les données. Existe-t-il une méthode Rpermettant d'estimer le type de distribution dont provient mon...

12
Bootstrap, Monte Carlo

On m'a posé la question suivante dans le cadre des devoirs: Concevoir et mettre en œuvre une étude de simulation pour examiner les performances du bootstrap pour obtenir des intervalles de confiance à 95% sur la moyenne d'un échantillon univarié de données. Votre implémentation peut être en R ou...

12
Corrélation de la série temporelle des volumes

Considérez le graphique suivant: La ligne rouge (axe de gauche) décrit le volume d'échange d'une certaine action. La ligne bleue (axe droit) décrit le volume de messages Twitter pour ce stock. Par exemple, le 9 mai (05-09), environ 1.100 millions de transactions et 4.000 tweets ont été effectués....

12
Comment communiquer au mieux l'incertitude?

Un problème majeur dans la communication des résultats des calculs statistiques aux médias et au public est la façon dont nous communiquons l'incertitude. Certes, la plupart des médias de masse semblent aimer un nombre dur et rapide, même si, sauf dans un nombre relativement restreint de cas, les...