Statistiques et Big Data

10
Confus au sujet de l'explication visuelle des vecteurs propres: comment des ensembles de données visuellement différents peuvent-ils avoir les mêmes vecteurs propres?

De nombreux manuels de statistiques fournissent une illustration intuitive de ce que sont les vecteurs propres d'une matrice de covariance: Les vecteurs u et z forment les vecteurs propres (enfin les axes propres). C'est logique. Mais la seule chose qui me déroute, c'est que nous extrayons des...

10
bayesglm (bras) contre MCMCpack

Les deux bayesglm()(dans le bras package R) et diverses fonctions dans le paquet MCMCpack sont destinés à faire l' estimation bayésienne des modèles linéaires généralisés, mais je ne suis pas sûr qu'ils calcul fait la même chose. Les fonctions MCMCpack utilisent la chaîne de Markov Monte Carlo pour...

10
Comment dois-je modéliser les interactions entre les variables explicatives lorsque l'une d'entre elles peut avoir des termes quadratiques et cubiques?

J'espère sincèrement avoir formulé cette question de manière à ce qu'elle puisse être résolue définitivement - sinon, faites-le moi savoir et je vais réessayer! Je devrais également, je suppose, noter que j'utiliserai R pour ces analyses. J'ai plusieurs mesures plant performance (Ys)dont je...

10
Est -

Dans le test d'hypothèse statistique, l'hypothèse nulle prend souvent la forme (au moins dans les livres que j'ai lus): H 0 : θ = θ 0 H 0 : θ ≤ θ 0 ou H 0 : θ 1 ≤ θ ≤ θ 2H0H0H_0H0:H0:θ=θ0θ≤θ0H0:θ=θ0H0:θ≤θ0 \begin{align*} H_0:&\theta=\theta_0\\ H_0:&\theta\le\theta_0 \end{align*}...

10
Comment extraire des informations d'une matrice de nuage de points lorsque vous avez un grand N, des données discrètes et de nombreuses variables?

Je joue avec l'ensemble de données sur le cancer du sein et j'ai créé un nuage de points de tous les attributs pour avoir une idée de ceux qui ont le plus d'effet sur la prédiction de la classe malignant(bleu) de benign(rouge). Je comprends que la ligne représente l'axe des x et la colonne...