Avez-vous des recommandations pour des livres pour l'auto-apprentissage des statistiques appliquées au niveau supérieur?

23

J'ai suivi plusieurs cours de statistiques au collège mais j'ai trouvé que mes études étaient très axées sur la théorie.

Je me demandais si certains d'entre vous avaient un texte en statistique appliquée (au niveau universitaire) que vous recommandez ou avec une bonne expérience.

jameselmore
la source
2
Les manuels de niveau supérieur sont généralement plutôt spécialisés, avec des titres comme la régression binomiale négative ou l' analyse des séries temporelles par les méthodes de l'espace d'état . Pouvez - vous être plus précis sur la zone qui vous intéresse, ou êtes - vous à la recherche d'une sorte d'aperçu?
Scortchi - Réintégrer Monica
1
Il serait utile que vous nous en disiez plus sur vos applications!
kjetil b halvorsen
Je m'intéresse principalement aux méthodes de régression et à la modélisation. Je rencontre beaucoup de VR binomiaux ainsi que des distributions aléatoires variables ou peu claires. Les applications sont assez larges donc une vue d'ensemble serait «idéale» mais n'est clairement pas la plus réalisable d'une requête haha.
jameselmore

Réponses:

20

Quelques très bons livres: "Statistics for Experimenters: Design, Innovation, and Discovery, 2nd Edition" par Box, Hunter & Hunter. C'est formellement un texte d'introduction (plus pour les gens de chimie et d'ingénierie) mais extrêmement bon du côté appliqué.

"Analyse des données à l'aide de modèles de régression et multiniveaux / hiérarchiques" par Andrew Gelman & Jennifer Hill. Très bon sur l'application de la modélisation de régression.

"The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Second Edition" (Springer Series in Statistics) 2nd (2009) Corrected Edition by Hastie Trevor, Tibshirani Robert & Friedman Jerome. Plus théorique que les deux premiers de ma liste, mais aussi extrêmement bon sur le pourquoi et le si des applications. - Version PDF publiée

"An Introduction to Statistical Learning" (Springer Series in Statistics) 6th (2015) par Gareth James, Daniela Witten, Trevor Hastie et Robert Tibshirani - Version PDF

Travailler votre chemin à travers ces trois livres devrait fournir une très bonne base pour les candidatures.

kjetil b halvorsen
la source
3
Box, Hunter, & Hunter vaut la peine d'être lu pour toute personne de tout niveau qui ne l'a pas déjà lu.
Scortchi - Réintégrer Monica
stats.stackexchange.com/users/17230/scortchi : C'est vrai!
kjetil b halvorsen
3
Je suis un grand fan du livre Gelman / Hill.
John
J'ai lu la plupart des éléments; c'est un trudge, et si vous cherchez des applications, vous devez savoir quoi ignorer. Quelques livres couvrant du matériel similaire avec des conseils plus pratiques et des exemples de code sont Kuhn & Johnson ( appliedpredictivemodeling.com ) et Berk ( springer.com/gp/book/9780387775005 ).
Drew N
9

Harrell (2001), Regression Modeling Strategies se distingue par

  • couvrant la modélisation du début à la fin: la réduction des données, l'imputation des valeurs manquantes et la validation des modèles figurent parmi les sujets abordés
  • l'accent mis sur l'explication de l'utilisation de différentes méthodes à différentes étapes
  • des exemples élaborés (code S & Plus / R) reprenant une grande partie du livre
Scortchi
la source
5

En plus de ceux-ci, Introductory Econometrics: A Modern Approach par Wooldrige a à peu près tout ce que vous pourriez vouloir savoir sur la régression, à un niveau avancé de premier cycle.

modifier: si vous avez affaire à des résultats catégoriques, Hastie et al est indispensable. En outre, l' analyse des données catégoriques par Agresti est une bonne approche classique, par opposition à l'approche d'apprentissage automatique de Hastie et al.

ssdecontrol
la source
1
Je ne pense pas que Wooldridge soit particulièrement avancé. À mon avis, une meilleure référence serait l'économétrie de Hayashi ou même le deuxième texte de Wooldridge, "Analyse économétrique des données transversales et de panel".
JohnK
5
Utiliser Hayashi pour les "statistiques appliquées", c'est comme utiliser un lance-flammes pour allumer une bougie. Il a demandé moins de théorie, pas plus. De plus, je pense que Wooldridge est conceptuellement sophistiqué pour un livre de premier cycle même s'il n'est pas si technique. Ce n'est pas comme si j'avais recommandé Stock & Watson.
shadowtalker
2
Je ne suis pas d'accord mais j'aime la métaphore;)
JohnK
3

Bayesian Data Analysis troisième édition (2013) par Gelman et al. Le niveau est mitigé mais le traitement que je trouve si bon que quelque chose de précieux peut être obtenu dans la plupart des chapitres. Si vous êtes intéressé par l'application de méthodes fondées sur des principes, je recommanderais ce livre.

conjectures
la source
1

Regression Modeling Strategies de Frank Harrell, est un excellent livre si vous connaissez déjà quelques notions de base. Il est fortement axé sur les applications (beaucoup d'exemples avec du code), la spécification des modèles, le diagnostic des modèles, le traitement des pièges courants et l'évitement des méthodes problématiques.

rep_ho
la source
0

J'ai utilisé "Engineering Statistics" de Montgomery et Runger. C'est assez bon (surtout si vous avez une solide formation en mathématiques). Je recommande également fortement de consulter le cours d'apprentissage en ligne de CalTech. C'est génial pour une introduction aux concepts ML (si cela fait partie de votre analyse de données). https://work.caltech.edu/telecourse.html .

utilisateur3712310
la source
0

J'ai écrit le livre Nonlinear Regression Modeling for Engineering Applications: Modeling, Model Validation, and Enabling Design of Experiments, Wiley, New York, NY, septembre 2016. ISBN 9781118597965, Rhinehart, RR parce que je ressentais un tel besoin. Le livre compte 361 pages et possède un site Web complémentaire avec des solutions de code ouvert Excel / VBA pour de nombreuses techniques. Visitez www.r3eda.com.

Russ Rhinehart
la source
0

La séquence des méthodes de régression de haut niveau du programme UW Stat PhD utilise les «méthodes de régression bayésienne et fréquenciste» de Wakefield, qui est un choix particulièrement bon pour les gens comme vous qui ont vu beaucoup de statistiques mathématiques. Il donne beaucoup plus de perspective que la plupart des livres sur les méthodes appliquées, même les plus simples, car il exploite beaucoup de mathématiques.

Sheridan Grant
la source
-1

J'ai utilisé College Statistics Made Easy de Sean Connolly. Il vise un premier / deuxième cours de statistique. Le matériel très, très facile à suivre. J'ai essayé quelques livres et aucun ne se compare à cela.

Mary
la source
Étant donné que le demandeur avait beaucoup de statistiques théoriques, ce n'est probablement pas ce qu'il cherche.
Sheridan Grant