Statistiques et Big Data

12
Dimension VC des modèles de régression

Dans la série de conférences Learning from Data , le professeur mentionne que la dimension VC mesure la complexité du modèle sur le nombre de points qu'un modèle donné peut briser. Donc, cela fonctionne parfaitement pour les modèles de classification où nous pourrions dire sur N points si le...

12
Quantifier la similitude entre deux ensembles de données

Résumé : essayer de trouver la meilleure méthode résume la similitude entre deux ensembles de données alignés de données en utilisant une seule valeur. Détails : Ma question est mieux expliquée avec un diagramme. Les graphiques ci-dessous montrent deux ensembles de données différents, chacun avec...

12
Variance de la statistique

Le de Cohen réddest l'une des façons les plus courantes de mesurer la taille d'un effet ( voir Wikipedia ). Il mesure simplement la distance entre deux moyennes en termes d'écart type groupé. Comment dériver la formule mathématique d'estimation de la variance du de Cohen rédd? Édition de décembre...

12
Quel est le nom de la méthode d'estimation de la densité où toutes les paires possibles sont utilisées pour créer une distribution de mélange normale?

Je viens de penser à une façon soignée (pas nécessairement bonne) de créer des estimations de densité unidimensionnelles et ma question est: Cette méthode d'estimation de la densité a-t-elle un nom? Sinon, s'agit-il d'un cas particulier d'une autre méthode dans la littérature? Voici la méthode:...

12
Comment interpréter la hauteur du tracé de densité

Comment dois-je interpréter la hauteur des tracés de densité: Par exemple, dans le graphique ci-dessus, le pic est d'environ 0,07 à x = 18. Puis-je en déduire qu'environ 7% des valeurs sont d'environ 18? Puis-je être plus précis que ça? Il y a aussi un deuxième pic à x = 30 avec une hauteur de...