Statistiques et Big Data

20
Statistiques élémentaires pour les jurés

J'ai été convoqué pour un jury. Je suis conscient de la pertinence des statistiques pour certains procès devant jury. Par exemple, le concept de "taux de base" et son application aux calculs de probabilité est parfois - peut-être toujours - pertinent. Quels sujets statistiques une personne dans ma...

20
Pourquoi s'embêter avec des approximations de rang bas?

Si vous avez une matrice avec n lignes et m colonnes, vous pouvez utiliser SVD ou d'autres méthodes pour calculer une approximation de bas rang de la matrice donnée. Cependant, l'approximation de bas rang aura toujours n lignes et m colonnes. Comment les approximations de bas rang peuvent-elles...

20
Test t apparié versus non apparié

Supposons que j'ai 20 souris. J'appaire les souris d'une manière ou d'une autre, de sorte que j'obtienne 10 paires. Aux fins de cette question, il pourrait s'agir d'un appariement aléatoire, OU il pourrait s'agir d'un appariement sensé, comme essayer d'associer des souris de la même portée, du même...

20
Comment fonctionne une distribution de Poisson lors de la modélisation de données continues et entraîne-t-elle une perte d'informations?

Une collègue analyse certaines données biologiques pour sa thèse avec une mauvaise hétéroscédasticité (figure ci-dessous). Elle est en train de l'analyser avec un modèle mixte mais a toujours des problèmes avec les résidus. La transformation logarithmique des variables de réponse nettoie les choses...

20
Test de séparabilité linéaire

Existe-t-il un moyen de tester la séparabilité linéaire d'un ensemble de données à deux classes dans des dimensions élevées? Mes vecteurs de caractéristiques mesurent 40 ans. Je sais que je peux toujours exécuter des expériences de régression logistique et déterminer le taux de réussite par rapport...