Questions marquées «aggregation»

Fait référence au «regroupement» de groupes de données potentiellement inhomogènes.

20
Quelles sont les valeurs correctes pour la précision et le rappel dans les cas de bord?

La précision est définie comme: p = true positives / (true positives + false positives) Est - il exact que, true positiveset false positivesapproche 0, la précision approche 1? Même question pour rappel: r = true positives / (true positives + false negatives) J'implémente actuellement un test...

13
LARS vs descente coordonnée pour le lasso

Quels sont les avantages et les inconvénients de l'utilisation de LARS [1] par rapport à l'utilisation de la descente de coordonnées pour ajuster la régression linéaire régularisée L1? Je m'intéresse principalement aux aspects de performance (mes problèmes ont tendance à avoir Ndes centaines de...

12
Quelles statistiques sont conservées sous agrégation?

Si nous avons une longue série temporelle à haute résolution, avec beaucoup de bruit, il est souvent judicieux d'agréger les données à une résolution inférieure (par exemple, des valeurs quotidiennes à mensuelles) pour mieux comprendre ce qui se passe, en supprimant efficacement le bruit. J'ai vu...

11
Dois-je exécuter des régressions distinctes pour chaque communauté, ou la communauté peut-elle simplement être une variable de contrôle dans un modèle agrégé?

J'utilise un modèle OLS avec une variable d'indice d'actif continue comme DV. Mes données sont agrégées à partir de trois communautés similaires à proximité géographique les unes des autres. Malgré cela, j'ai pensé qu'il était important d'utiliser la communauté comme variable de contrôle. Il...

9
Calculer la courbe ROC pour les données

Donc, j'ai 16 essais dans lesquels j'essaie d'authentifier une personne à partir d'un trait biométrique en utilisant Hamming Distance. Mon seuil est fixé à 3,5. Mes données sont ci-dessous et seul l'essai 1 est un vrai positif: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 7 0.47...