Questions marquées «dataset»

13
Meilleures façons d'agréger et d'analyser les données

Ayant récemment commencé à m'enseigner moi-même l'apprentissage automatique et l'analyse des données, je me retrouve à frapper un mur de briques sur la nécessité de créer et d'interroger de grands ensembles de données. Je voudrais prendre des données que j'ai agrégées dans ma vie professionnelle et...

12
Différences entre PROC Mixed et lme / lmer en R - degrés de liberté

Remarque: cette question est une rediffusion, car ma question précédente a dû être supprimée pour des raisons juridiques. En comparant PROC MIXED de SAS avec la fonction lmedu nlmepackage dans R, je suis tombé sur des différences assez confuses. Plus précisément, les degrés de liberté dans les...

12
Meilleures pratiques pour créer des «données bien rangées»

Hadley Wickham a écrit un article stellaire intitulé "Tidy Data" ( lien ) dans JSS l'année dernière sur la manipulation des données et la mise en état "optimal" des données afin d'effectuer une analyse. Cependant, je me demandais quelles étaient les meilleures pratiques en termes de présentation de...

12
L'idée de rendre les données ont une moyenne nulle

Je vois souvent des gens qui font d'une dimension / caractéristique d'un ensemble de données une moyenne nulle en supprimant la moyenne de tous les éléments. Mais je n'ai jamais compris pourquoi le faire? Quel effet cela fait-il en tant qu'étape de prétraitement? Améliore-t-il les performances de...

11
Combien d'informations pouvez-vous extraire d'un nom?

Un nom: d'abord, éventuellement un deuxième prénom, et un nom de famille. Je suis curieux de savoir combien d'informations vous pouvez extraire d'un nom, en utilisant des ensembles de données accessibles au public. Je sais que vous pouvez obtenir ce qui suit n'importe où entre une probabilité...

11
Tutoriel PCA pratique avec données

La recherche sur Internet du didacticiel PCA donne des milliers de résultats (même des vidéos). Beaucoup de tutoriels sont très bons. Mais je ne suis pas en mesure de trouver d'exemple pratique où PCA est expliqué en utilisant des ensembles de données que je peux utiliser pour la démonstration....

10
Fréquence maximale et fermée - Réponse incluse

My  dataset:My  dataset:My \ \ dataset: 1:A,B,C,E1:A,B,C,E1: A,B,C,E 2:A,C,D,E2:A,C,D,E2:A,C,D,E 3:     B,C,E3:     B,C,E3:\ \ \ \ \ B,C,E 4:A,C,D,E4:A,C,D,E4:A,C,D,E 5:    C,D,E5:    C,D,E5:\ \ \ \ C, D, E 6:    A,D,E6:    A,D,E6: \ \ \ \ A, D,E Je souhaite connaître les ensembles d'éléments...

10
La sélection des fonctionnalités doit-elle être effectuée uniquement sur les données d'entraînement (ou toutes les données)?

La sélection des fonctionnalités doit-elle être effectuée uniquement sur les données d'entraînement (ou toutes les données)? J'ai parcouru des discussions et des articles tels que Guyon (2003) et Singhi et Liu (2006) , mais je ne suis toujours pas sûr de la bonne réponse. La configuration de mon...

10
Bons exemples d'ACP pour l'enseignement

J'enseigne l'algèbre linéaire à une classe d'ingénieurs, de sociologues et de programmeurs informatiques. Nous venons de faire une décomposition en valeurs singulières, et nous avons un jour supplémentaire, alors j'ai pensé parler de la relation entre la décomposition en valeurs singulières et...