Statistiques et Big Data

8
Bon livre de référence pour l'épidémiologie

Je recherche un bon ouvrage de référence en épidémiologie. J'ai Rothman's Epidemiology: An introduction et Porta's A Dictionary of Epidemiology . Rothman était une grosse déception car il est très simpliste et manque de tout ce qui est au-delà de l'évidence après les études de base. J'ai entendu...

8
Distance métrique et malédiction des dimensions

Certains où j'ai lu une note que si vous avez beaucoup de paramètres et que vous essayez de trouver une "métrique de similitude" entre ces vecteurs, vous pouvez avoir une "malédiction de dimensioalité". Je crois que cela signifiait que la plupart des scores de similitude seront égaux et ne vous...

8
Documents / exemples d'exploration de données

Je recherche des articles / sites Web de taille moyenne à longue sur l'exploration de données, en particulier où un ensemble de données est exploré en profondeur de la préparation des données au modèle final. Je suis particulièrement intéressé par les discussions sur l'application des algos...

8
À quoi servent les matrices denses en statistiques?

OK, je ne suis pas statisticien (même pas proche). Je suis un chercheur en calcul haute performance et je voulais quelques cas de test pour les matrices denses de grande taille (supérieures à 5000x5000). J'avais demandé ici et quelques autres endroits mais je n'ai jamais reçu de réponse d'un...

8
Comprendre l'analyse factorielle

Puis-je comprendre l'analyse factorielle de la manière suivante? Supposons que j'ai 5 variables indépendantes (A, B, C, D, E) L'analyse factorielle me permet de faire de (D, E) des variables dépendantes et de les faire être des combinaisons linéaires de (A, B, C). Par conséquent, je n'aurai besoin...

8
Confus par l'implémentation de Ridge par MATLAB

J'ai deux implémentations différentes de ridgeMATLAB. L'un est tout simplement x=(A′A+Iλ)−1A′bx=(A′A+Iλ)−1A′b\mathbf x = (\mathbf{A}'\mathbf{A}+\mathbf{I}\lambda)^{-1}\mathbf{A}'\mathbf b (comme on le voit sur la page de régression de crête de Wikipedia ), avecII\mathbf{I} étant la matrice...

8
Modèles d'apprentissage par paires open source

Je résous un problème de classification en utilisant un ensemble de formation par apprentissage en binôme. Nous avons 2 classes: mauvaises et bonnes . Nous avons également des paires d'objets(ai,bi)ni=1(ai,bi)i=1n(a_i,b_i)_{i=1}^n, ce qui signifie que l'objet aiaia_i est mieux quebibib_i. Chaque...