Questions marquées «dataset»

10
L'éducation statistique des enfants dans différents pays?

Je suis intéressé de savoir quel niveau de statistiques les enfants apprennent dans différents pays du monde. Pourriez-vous s'il vous plaît suggérer des données / liens qui éclairent ce qui se passe à cet égard? Je vais commencer. Israël: Les étudiants qui suivent des cours de mathématiques avancés...

10
Bons exemples d'ACP pour l'enseignement

J'enseigne l'algèbre linéaire à une classe d'ingénieurs, de sociologues et de programmeurs informatiques. Nous venons de faire une décomposition en valeurs singulières, et nous avons un jour supplémentaire, alors j'ai pensé parler de la relation entre la décomposition en valeurs singulières et...

10
Fréquence maximale et fermée - Réponse incluse

My  dataset:My  dataset:My \ \ dataset: 1:A,B,C,E1:A,B,C,E1: A,B,C,E 2:A,C,D,E2:A,C,D,E2:A,C,D,E 3:     B,C,E3:     B,C,E3:\ \ \ \ \ B,C,E 4:A,C,D,E4:A,C,D,E4:A,C,D,E 5:    C,D,E5:    C,D,E5:\ \ \ \ C, D, E 6:    A,D,E6:    A,D,E6: \ \ \ \ A, D,E Je souhaite connaître les ensembles d'éléments...

10
La sélection des fonctionnalités doit-elle être effectuée uniquement sur les données d'entraînement (ou toutes les données)?

La sélection des fonctionnalités doit-elle être effectuée uniquement sur les données d'entraînement (ou toutes les données)? J'ai parcouru des discussions et des articles tels que Guyon (2003) et Singhi et Liu (2006) , mais je ne suis toujours pas sûr de la bonne réponse. La configuration de mon...

9
Les données d'entraînement sont déséquilibrées - mais mon ensemble de validation devrait-il l'être également?

J'ai étiqueté des données composées de 10000 exemples positifs et 50000 exemples négatifs, ce qui donne un total de 60000 exemples. Évidemment, ces données sont déséquilibrées. Disons maintenant que je veux créer mon ensemble de validation et que je souhaite utiliser 10% de mes données pour le...

9
Calculer la courbe ROC pour les données

Donc, j'ai 16 essais dans lesquels j'essaie d'authentifier une personne à partir d'un trait biométrique en utilisant Hamming Distance. Mon seuil est fixé à 3,5. Mes données sont ci-dessous et seul l'essai 1 est un vrai positif: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 7 0.47...

9
Comment comparer les événements observés aux événements attendus?

Supposons que j'ai un échantillon de fréquences de 4 événements possibles: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 et j'ai les probabilités attendues que mes événements se produisent: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 Avec la somme des fréquences observées de mes quatre événements (18), je peux calculer...

9
Comment gérer les lacunes / NaN dans les données de séries chronologiques lors de l'utilisation de Matlab pour l'autocorrélation et les réseaux de neurones?

J'ai une série chronologique de mesures (séries de hauteurs unidimensionnelles). Au cours de la période d'observation, le processus de mesure s'est interrompu pendant quelques instants. Ainsi, les données résultantes sont un vecteur avec NaN où il y avait des lacunes dans les données. L'utilisation...

8
Fonction de vraisemblance des données tronquées

J'ai un peu de mal à comprendre le concept et la dérivation de la probabilité de données tronquées. Par exemple, si je veux trouver la fonction de vraisemblance basée sur un échantillon d'une distribution, mais en prenant un échantillon de la distribution, j'observe les valeurs tronquées (où il y a...