J'ai suivi plusieurs cours de statistiques au collège mais j'ai trouvé que mes études étaient très axées sur la théorie.
Je me demandais si certains d'entre vous avaient un texte en statistique appliquée (au niveau universitaire) que vous recommandez ou avec une bonne expérience.
regression
references
modeling
experiment-design
application
jameselmore
la source
la source
Réponses:
Quelques très bons livres: "Statistics for Experimenters: Design, Innovation, and Discovery, 2nd Edition" par Box, Hunter & Hunter. C'est formellement un texte d'introduction (plus pour les gens de chimie et d'ingénierie) mais extrêmement bon du côté appliqué.
"Analyse des données à l'aide de modèles de régression et multiniveaux / hiérarchiques" par Andrew Gelman & Jennifer Hill. Très bon sur l'application de la modélisation de régression.
"The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Second Edition" (Springer Series in Statistics) 2nd (2009) Corrected Edition by Hastie Trevor, Tibshirani Robert & Friedman Jerome. Plus théorique que les deux premiers de ma liste, mais aussi extrêmement bon sur le pourquoi et le si des applications. - Version PDF publiée
"An Introduction to Statistical Learning" (Springer Series in Statistics) 6th (2015) par Gareth James, Daniela Witten, Trevor Hastie et Robert Tibshirani - Version PDF
Travailler votre chemin à travers ces trois livres devrait fournir une très bonne base pour les candidatures.
la source
Harrell (2001), Regression Modeling Strategies se distingue par
la source
En plus de ceux-ci, Introductory Econometrics: A Modern Approach par Wooldrige a à peu près tout ce que vous pourriez vouloir savoir sur la régression, à un niveau avancé de premier cycle.
modifier: si vous avez affaire à des résultats catégoriques, Hastie et al est indispensable. En outre, l' analyse des données catégoriques par Agresti est une bonne approche classique, par opposition à l'approche d'apprentissage automatique de Hastie et al.
la source
Bayesian Data Analysis troisième édition (2013) par Gelman et al. Le niveau est mitigé mais le traitement que je trouve si bon que quelque chose de précieux peut être obtenu dans la plupart des chapitres. Si vous êtes intéressé par l'application de méthodes fondées sur des principes, je recommanderais ce livre.
la source
J'ai beaucoup utilisé le manuel de Sheskin sur les procédures statistiques paramétriques et non paramétriques . Il s'agit d'un large aperçu des méthodes de test d'hypothèse, avec de bonnes introductions à la théorie et des tonnes de notes sur les subtilités de chacune. Vous pouvez voir la table des matières sur le site de l'éditeur (lié ci-dessus).
la source
Regression Modeling Strategies de Frank Harrell, est un excellent livre si vous connaissez déjà quelques notions de base. Il est fortement axé sur les applications (beaucoup d'exemples avec du code), la spécification des modèles, le diagnostic des modèles, le traitement des pièges courants et l'évitement des méthodes problématiques.
la source
J'ai utilisé "Engineering Statistics" de Montgomery et Runger. C'est assez bon (surtout si vous avez une solide formation en mathématiques). Je recommande également fortement de consulter le cours d'apprentissage en ligne de CalTech. C'est génial pour une introduction aux concepts ML (si cela fait partie de votre analyse de données). https://work.caltech.edu/telecourse.html .
la source
J'ai écrit le livre Nonlinear Regression Modeling for Engineering Applications: Modeling, Model Validation, and Enabling Design of Experiments, Wiley, New York, NY, septembre 2016. ISBN 9781118597965, Rhinehart, RR parce que je ressentais un tel besoin. Le livre compte 361 pages et possède un site Web complémentaire avec des solutions de code ouvert Excel / VBA pour de nombreuses techniques. Visitez www.r3eda.com.
la source
La séquence des méthodes de régression de haut niveau du programme UW Stat PhD utilise les «méthodes de régression bayésienne et fréquenciste» de Wakefield, qui est un choix particulièrement bon pour les gens comme vous qui ont vu beaucoup de statistiques mathématiques. Il donne beaucoup plus de perspective que la plupart des livres sur les méthodes appliquées, même les plus simples, car il exploite beaucoup de mathématiques.
la source
J'ai utilisé College Statistics Made Easy de Sean Connolly. Il vise un premier / deuxième cours de statistique. Le matériel très, très facile à suivre. J'ai essayé quelques livres et aucun ne se compare à cela.
la source