Statistiques et Big Data

8
Lorsque vous faites des inférences sur les moyennes de groupe, les intervalles crédibles sont-ils sensibles à la variance intra-sujet alors que les intervalles de confiance ne le sont pas?

Ceci est un spin-off de cette question: comment comparer deux groupes avec plusieurs mesures pour chaque individu avec R? Dans les réponses (si j'ai bien compris), j'ai appris que la variance intra-sujet n'affecte pas les inférences faites sur les moyennes de groupe et il est correct de simplement...

8
Pourquoi utiliser bayesglm?

Ma question générale est: pourquoi utiliser à la bayesglmplace d'autres méthodes de classification? Remarque: Je ne m'intéresse qu'à la prédiction. J'ai une quantité décente de données (~ 100 000 obs.). J'ai l'impression que la taille de l'échantillon est suffisamment grande pour que les paramètres...

8
À la recherche du «coude» dans les données

La subitisation est l'énumération rapide et précise des affichages à faible numérosité, qui se distingue du comptage par une forte non-linéarité dans le tracé des temps de réponse. Vous trouverez ci-dessous un graphique représentatif de Watson, DG, Maylor, EA et Bruce, LAM (2007). Notez que les...

8
Cartes auto-organisées vs k-means du noyau

Pour une application, je souhaite regrouper des données (potentiellement de grande dimension) et extraire la probabilité d'appartenir à un cluster. Je considère en ce moment des cartes auto-organisées ou des k-moyens du noyau pour faire le travail. Quels sont les avantages et les inconvénients de...

8
Démonstration du biais quantile de l'échantillon

En faisant quelques simulations, j'ai réalisé que le quantile d'échantillon est un estimateur biaisé du vrai quantile. Et, selon mes simulations, potentiellement très biaisée. J'ai été surpris de ce résultat car le CDF empirique n'est pas biaisé, mais après quelques recherches sur Internet, j'ai...

8
Exemples pour une classe SVM dans R

J'essaie de faire du SVM à une classe dans R. J'ai essayé d'utiliser le package kernlab e1071 / ksvm. Mais je ne sais pas si je le fais correctement. Existe-t-il un exemple de travail pour SVM à une classe dans R? Aussi, Je donne une grande matrice de prédicteurs sous forme de X. Puisqu'il est...

8
Modèle de factorisation matricielle pour les systèmes recommandés comment déterminer le nombre de fonctionnalités latentes?

J'essaie de concevoir une technique de factorisation matricielle pour un élément utilisateur simple, un système de recommandation de notes. J'ai 2 questions à ce sujet. Tout d'abord dans une implémentation simple que j'ai vue de la technique de factorisation matricielle pour la recommandation de...