Statistiques et Big Data

9
GAM adaptatif lisse en mgcv

Le livre de Simon Wood sur les GAM et son package R associé mgcv sont à la fois très détaillés et informatifs en ce qui concerne la théorie GAM et l'ajustement du modèle aux données réelles et simulées. Pour les lissages 1D, il n'y a vraiment pas grand-chose à craindre, sauf pour décider...

9
Pourquoi l'intervalle crédible bayésien dans cette régression polynomiale est-il biaisé alors que l'intervalle de confiance est correct?

Considérez le graphique ci-dessous dans lequel j'ai simulé des données comme suit. Nous regardons un résultat binaire pour lequel la vraie probabilité d'être 1 est indiquée par la ligne noire. La relation fonctionnelle entre une covariable x et est un polynôme de troisième ordre avec lien...

9
Données corrélées de grande dimension et principales caractéristiques / covariables découvertes; test d'hypothèses multiples?

J'ai un ensemble de données avec environ 5 000 caractéristiques / covariables souvent corrélées et une réponse binaire. Les données m'ont été données, je ne les ai pas collectées. J'utilise Lasso et boosting de gradient pour construire des modèles. J'utilise la validation croisée imbriquée itérée....

9
T implique l'indépendance de et ?

T implique l'indépendance de et ?Cov(f(X),Y)=0∀f(.)Cov(f(X),Y)=0∀f(.)\mathbb{Cov} \left(f(X),Y\right) = 0 \; \forall \; f(.)XXXYYY Je ne suis au courant de la définition suivante de l' indépendance entre et .XXXYYY fx,y(x,y)=fx(x)fy(y)fx,y(x,y)=fx(x)fy(y) f_{x,y}(x,y) = f_x(x)f_y(y)...

9
Ce qui est plus élevé,

J'ai donc eu un test de probabilité et je ne pouvais pas vraiment répondre à cette question. Il a juste demandé quelque chose comme ceci: "En considérant que est une variable aléatoire, 0 , utilisez l'inégalité correcte pour prouver ce qui est supérieur ou égal, E (X ^ 2) ^ 3 ou E (X ^ 3) ^ 2...