Je suis très intéressé par le potentiel de l'analyse statistique pour la simulation / prévision / estimation de fonction, etc.
Cependant, je n'en sais pas grand-chose et mes connaissances mathématiques sont encore assez limitées - je suis un étudiant de premier cycle en génie logiciel.
Je cherche un livre qui me permettrait de commencer sur certaines choses que je continue de lire: la régression linéaire et d'autres types de régression, les méthodes bayésiennes, les méthodes de monte carlo, l'apprentissage automatique, etc. Je veux aussi commencer avec R donc si il y avait un livre qui combinait les deux, ce serait génial.
De préférence, je voudrais que le livre explique les choses conceptuellement et pas trop en détails techniques - je voudrais que les statistiques soient très intuitives pour moi, car je comprends qu'il y a beaucoup d'embûches risquées dans les statistiques.
Je suis bien sûr disposé à lire plus de livres pour améliorer ma compréhension des sujets que je juge précieux.
la source
Pour une combinaison de R avec de nombreuses méthodes que vous décrivez, en plus du texte de Maindonald et Braun mentionné par @ Jeromy Anglim, je vous suggère de jeter un œil à ces deux livres de Julian Faraway:
Les deux ont des introductions raisonnablement simples aux divers sujets, ce dernier couvre un large éventail d'approches plus modernes de la régression, y compris de nombreuses techniques d'apprentissage automatique, mais le fait à un rythme plus rapide avec moins de description, et les deux illustrent les techniques via le code R.
Vous pouvez obtenir un code sur la section Livres du site Web R pour vous donner 20% de réduction sur le prix public conseillé si vous achetez directement auprès de Chapman & Hall / CRC Press, mais vérifiez le prix Amazon ou similaire pour votre région car souvent la réduction sur Amazon est compétitive avec celui du prix de l'éditeur après la remise.
L'une des bonnes choses à propos de cette paire de livres est qu'ils vous donnent une bonne idée des méthodes modernes avec suffisamment de détails pour explorer ensuite les domaines que vous souhaitez approfondir avec des textes plus spécialisés.
Une partie du contenu de ces livres est disponible dans un PDF en ligne par Julian, via la section Documents contribués du site Web R. Je vous encourage à parcourir cette section pour voir s'il existe d'autres documents qui pourraient vous aider à démarrer sans avoir à débourser de l'argent. Une première version du texte qui est devenu la première édition du texte de Maindonald et Braun peut également être trouvée dans cette section.
la source
Eh bien, si vous voulez un aperçu de la plupart des méthodes statistiques et code R pour eux, vous ne pouvez pas vous tromper avec Venables et de la statistique appliquée moderne de Ripley dans S .
Son succint, lucide et a suffisamment de code R pour vous permettre de commencer à peu près n'importe quel sujet statistique que vous souhaitez nommer.
J'ai acheté ce livre et je me méfiais du prix par rapport au nombre de pages, mais cela valait bien l'investissement. Ils supposent le calcul et l'algèbre linéaire, mais étant donné que vous êtes ingénieur, cela ne devrait pas poser trop de problème.
Leur programmation S est également merveilleuse, mais probablement pas ce que vous recherchez en ce moment.
la source
Les éléments de l'apprentissage statistique peuvent être peu intimidants pour les débutants. Je recommanderais de lire " Introduction à l'apprentissage statistique avec des applications en R ", qui peut être téléchargé gratuitement à partir d'ici -> http://www-bcf.usc.edu/~gareth/ISL/ Il a également élaboré des exemples en R à la fin de chaque chapitre.
" Machine Learning: An algorithmic Perspective " par Stephen Marsland couvre également un plus large éventail de sujets sans trop entrer dans les mathématiques.
la source
Les réponses précédentes ont beaucoup de choses sur l'application. En ce qui concerne le matériel conceptuel et une bonne réflexion statistique, je recommanderais la théorie des probabilités: la logique de la science par Edwin Jaynes. Les trois premiers chapitres sont disponibles gratuitement ici
Cependant, il n'a pas beaucoup de programmes informatiques, donc le côté application est sur les problèmes les plus stylisés. Dispose d'un brillant chapitre sur les paradoxes de la théorie des probabilités, à une exception près, le "paradoxe de la marginalisation", qui est correctement résolu ici (bien que Jaynes "reçoive essentiellement la leçon" en ce qu'un prieur impropre devrait être la limite d'une séquence de prieurs appropriés) .
la source
Les suggestions faites jusqu'à présent sont toutes excellentes mais se concentrent sur les techniques les plus avancées et sophistiquées utilisant le logiciel R. Pour un excellent aperçu intuitif des techniques multivariées classiques, le cadre sous-jacent pour les approches les plus à jour, y compris la régression, l'ANOVA, l'analyse factorielle, l'analyse en grappes, l'analyse discriminante, l'analyse du tableau de contingence et l'analyse des équations structurelles, la multivariée de Dillon et Goldstein Les statistiques publiées par Wiley dans les années 80 restent un classique. Il est lucide et appliqué dans ses exemples sans être trop théorique ou lié au logiciel.
Dillon et Goldstein est le livre que je recommanderais à tous ceux qui veulent comprendre d'où proviennent les méthodes modernes d'apprentissage automatique.
la source
Je recommanderais "Time Series Analysis et ses applications avec des exemples R" par Shumway et Stoffer
La troisième édition: http://www.stat.pitt.edu/stoffer/tsa3/
Cliquez et achetez http://www.amazon.com/Time-Analysis-Its-Applications-Statistics/dp/144197864X/ref=dp_ob_title_bk
la source
Le livre de recettes R est un excellent moyen de sauter dans R et d'apprendre à l'utiliser. C'est très pratique, donc c'est génial pour apprendre à utiliser la langue, mais vous devriez aussi chercher un bon livre de théorie.
la source