J'aimerais connaître ou avoir des références sur le processus d'analyse que la plupart des analystes de données statistiques passent par chaque projet d'analyse de données.
Si je fais une "liste", pour terminer un projet d'analyse de données, un analyste doit:
- recueillir d'abord les exigences du projet,
- planifier / concevoir son analyse de données sur la base de ces exigences avant
- en fait le prétraitement des données,
- exécuter l'analyse des données et
- rédiger un rapport basé sur ses résultats d'analyse.
Pour cette question, je suis intéressé par plus de détails sur l'étape 2. Mais je comprends que ce n'est pas pratiquement clair car l'analyste pourrait avoir à changer son plan ou sa conception en fonction de la sortie de l'analyse des données. Y a-t-il une référence à ce sujet?
la source
J'ai trouvé The Workflow of Data Analysis Using Stata être un bon livre, en particulier (mais pas seulement) en tant qu'utilisateur Stata. J'ai trouvé beaucoup de points de désaccord, mais même cela a aidé à clarifier pourquoi je fais les choses de certaines façons.
la source
CRISP-DM , inventé par la société SPSS (qui appartient maintenant à IBM) est un acronyme pour le processus d'exploration de données, qui est le même que pour "analyse de données". SAS a un processus similaire appelé SEMMA .
la source