J'ai lu le livre de Tukey "Exploratory Data Analysis". Écrit en 1977, le livre met l’accent sur les méthodes papier / crayon. Existe-t-il un successeur plus «moderne» qui prenne en compte le fait que nous pouvons maintenant tracer instantanément de grands ensembles de données?
52
Réponses:
La chose la plus proche est la visualisation de données de Cleveland . Il s'agit d'analyse exploratoire de données, de visualisations générées par ordinateur, de profondeur, de classique.
la source
Eh bien, ce n'est pas une réplique exacte, mais j'ai trouvé des tonnes de conseils de traçage (et de code R) utiles dans l' analyse des données de Gelman et Hill utilisant des modèles de régression et de hiérarchie / multiniveaux
De plus, son blog regorge souvent de conseils graphiques utiles.
la source
Graphiques interactifs pour l’analyse de données: Principes et exemples est celui que j’aime; La description de l'ouvrage indique qu'elle "traite de l'analyse exploratoire de données (EDA) et de la façon dont les méthodes graphiques interactives peuvent aider à obtenir des informations ainsi qu'à générer de nouvelles questions et hypothèses à partir de jeux de données".
la source
Le livre ggplot2 de Hadley Wickham est intéressant car il enseigne à la fois la grammaire graphique et la manière d'utiliser le logiciel ggplot2.
la source
Il convient de mentionner ici l' exploration de données en génie, en sciences et en médecine de Ronald Pearson . Son lectorat principal semble être des scientifiques qui n’ont pas peur des mathématiques et qui souhaiteraient connaître davantage de statistiques. C'est un groupe assez important et un groupe bien représenté ici. C'est un peu bizarre et décalé, mais cela couvre beaucoup de terrain et inclut beaucoup de conseils judicieux. Tukey n'est pas revisité dans le sens où il propose de nombreuses idées nouvelles, mais il peut être enrichissant d'étudier, même si vous pensez que vous êtes un peu pervers.
Ce livre semble avoir attiré très peu d'attention, très probablement parce qu'il est très coûteux, qu'il ne convient évidemment pas comme texte de cours et qu'il n'est pour l'instant disponible que sous forme de livre relié. Mais il est intelligent, lisible et exempt de la corbeille des manuels d’introduction modernes (pages et pages d’exercices élémentaires, icônes idiotes, photos gratuites de jeunes heureux, mise en page compliquée avec des boîtes, etc.).
la source
Également des graphiques interactifs et dynamiques pour l'analyse des données: avec des exemples utilisant R et GGobi, Cook et Swayne
Deux chapitres, accessibles au public sur le Web, décrivent le processus d’analyse des données et de traitement des valeurs manquantes. Antony Unwin est sur le point de publier un nouveau livre.
la source
Deux autres bons livres à lire sont Beautiful Visualization et Beautiful Data. Ce sont des livres édités, il existe d’excellents exemples d’exploration de données à l’aide de graphiques, ainsi que des chapitres absolument effroyables.
Un autre livre qui contient de bons exemples d’utilisation de ggplot2 est un nouveau de Winston Chang
la source
Je pense à Comprendre les analyses robustes et exploratoires de Hoaglin, Mosteller et Tukey, le volume connexe Exploration des tableaux de données et des formes en tant que suivi technique de l’EDA. Je vois aussi l'analyse et la régression des données, un deuxième cours de statistique de Mosteller et Tukey, faisant suite à l'AED. Les divers livres de Cleveland mentionnés ci-dessus sont des trésors.
la source