Je sais que les gens aiment fermer les doublons, je ne demande donc pas de référence pour commencer à apprendre les statistiques (comme ici ).
J'ai un doctorat en mathématiques mais je n'ai jamais appris les statistiques. Quel est le chemin le plus court vers la connaissance équivalente vers un diplôme de premier ordre en statistiques BS et comment puis-je mesurer le résultat obtenu?
Si une liste de livres suffit (en supposant que je fasse les exercices, disons), c'est formidable. Oui, je m'attends à ce que les problèmes soient résolus implicitement, mais je souhaite accélérer autant que possible. Je ne cherche pas un traitement incroyablement rigoureux à moins que cela ne fasse partie de ce que les majors statistiques apprennent généralement.
la source
Réponses:
(Très) courte histoire
Bref, en un sens, les statistiques sont comme n'importe quel autre domaine technique: il n'y a pas de voie rapide .
Longue histoire
Les programmes de licence en statistiques sont relativement rares aux États-Unis. L'une des raisons pour lesquelles je pense que c'est vrai, c'est qu'il est assez difficile d'intégrer tout ce qui est nécessaire pour bien apprendre les statistiques dans un programme de premier cycle. Cela est particulièrement vrai dans les universités qui ont d'importantes exigences en matière d'enseignement général.
Développer les compétences nécessaires (mathématiques, calcul et intuitives) nécessite beaucoup d'efforts et de temps. Les statistiques peuvent commencer à être comprises à un niveau "opérationnel" assez décent une fois que l'étudiant a maîtrisé le calcul et une quantité décente d'algèbre linéaire et matricielle. Cependant, tout statisticien appliqué sait qu'il est assez facile de se retrouver sur un territoire qui ne se conforme pas à une approche de type «cookie cutter» ou à base de recettes. Pour bien comprendre ce qui se passe sous la surface, il faut au préalablematurité mathématique et, dans le monde actuel, informatique, qui ne sont réellement réalisables que dans les dernières années de la formation de premier cycle. C’est une des raisons pour laquelle la véritable formation statistique débute principalement au niveau des États membres aux États-Unis (l’Inde, avec son ISI dédié, est un peu différent. Un argument similaire pourrait être avancé pour certaines formations basées au Canada. Études statistiques de premier cycle basées en Europe ou en Russie ayant un avis éclairé.)
Presque n'importe quel emploi (intéressant) exigerait une formation de niveau MS et les emplois vraiment intéressants (à mon avis) requièrent essentiellement une formation de niveau doctorat.
Étant donné que vous avez un doctorat en mathématiques, bien que nous ne sachions pas dans quel domaine, voici mes suggestions pour quelque chose de plus proche d’une formation de niveau MS. J'inclus des remarques entre parenthèses pour expliquer les choix.
Compléments
Voici quelques autres livres, la plupart du temps un peu plus avancés, de nature théorique et / ou auxiliaire, qui sont utiles.
Textes plus avancés (niveau doctorat)
Lehmann et Casella, théorie de l'estimation ponctuelle . (Traitement au doctorat de l'estimation ponctuelle. Une partie du défi de ce livre consiste à le lire et à comprendre ce qui est une faute de frappe et ce qui ne l'est pas. Quand vous vous verrez les reconnaître rapidement, vous comprendrez que vous comprenez. de ce type, surtout si vous plongez dans les problèmes.)
Lehmann et Romano, Test d'hypothèses statistiques . (Traitement au niveau du doctorat des tests d'hypothèses. Pas autant de fautes de frappe que TPE ci-dessus.)
A. van der Vaart, Statistiques asymptotiques . (Un beau livre sur la théorie asymptotique de la statistique avec de bons conseils sur les domaines d'application. Ce n'est pas un livre appliqué. Mon seul reproche, c'est que des notations assez bizarres sont utilisées et que des détails sont parfois balayés sous le tapis.)
la source
Je ne peux pas parler pour les écoles les plus rigoureuses, mais je fais un baccalauréat en statistique générale (la plus rigoureuse de mon école) à l'université de Californie à Davis, et je compte beaucoup sur la rigueur et la dérivation. Un doctorat en mathématiques vous sera utile, dans la mesure où vous aurez une solide expérience en analyse réelle et en algèbre linéaire - des compétences utiles en statistiques. Dans mon programme de statistiques, environ 50% des travaux vont soutenir les bases (algèbre linéaire, analyse réelle, calcul, probabilité, estimation), et les 50% restants vont à des sujets spécialisés qui reposent sur les bases (non paramétrique, calcul, ANOVA / Régression, série chronologique, analyse bayésienne).
Une fois que vous avez les bases, passer aux détails n’est généralement pas trop difficile. La plupart des élèves de mes classes ont des difficultés avec les preuves et l'analyse réelle, et comprennent facilement les concepts statistiques. Il est donc indéniable que les antécédents en mathématiques seront utiles. Cela étant dit, les deux textes suivants couvrent assez bien de nombreux sujets traités en statistique. Les deux ont été recommandés dans le lien que vous avez fourni, soit dit en passant, donc je ne dirais pas que votre question et celle que vous avez liée sont nécessairement non corrélées.
Méthodes mathématiques de la statistique , par Harald Cramer
Toutes les statistiques: un cours concis sur l'inférence statistique , par Larry Wasserman
la source
La Royal Statistical Society du Royaume-Uni propose le diplôme de deuxième cycle en statistique, qui se situe au niveau d'un bon baccalauréat. Un programme, une liste de lecture et des documents antérieurs sont disponibles sur leur site Web . Je sais que les mathématiciens l'utilisent pour se mettre à niveau dans les statistiques. Passer les examens (officiellement ou dans le confort de votre propre étude) pourrait être un moyen utile de mesurer votre présence.
la source
Je consulterais les sites Web des programmes des écoles de statistiques les plus performantes, noterais les livres qu’ils utilisent dans leurs cours de premier cycle, voir quels étaient ceux qui jouissaient d’une excellente réputation sur Amazon et les commander dans votre bibliothèque publique / universitaire.
Quelques écoles à considérer:
Complétez les textes avec les différents sites vidéo de conférence tels que MIT OCW et videolectures.net.
Caltech n’a pas de diplôme de premier cycle en statistiques, mais vous ne vous tromperez pas en suivant le programme de leurs cours de statistiques de premier cycle.
la source
J'ai vu Statistical Inference, de Silvey, utilisé par des mathématiciens qui avaient besoin d'une certaine connaissance pratique de la statistique. C'est un petit livre, et devrait de droit être bon marché. En regardant http://www.amazon.com/Statistical-Inference-Monographs-Statistics-Probability/dp/0412138204/ref=sr_1_1?ie=UTF8&s=books&qid=1298750064&sr=1-1 , il semble que ce soit une seconde main bon marché.
C'est vieux et se concentre sur les statistiques classiques. Bien que ce ne soit pas très abstrait, il est destiné à un public raisonnablement mathématique - la plupart des exercices sont issus du diplôme en statistique mathématique de Cambridge (Royaume-Uni), qui est essentiellement une maîtrise.
la source
Concernant la mesure de vos connaissances: Vous pouvez participer à certains concours d’exploration et d’analyse de données, tels que 1 , 2 , 3 , 4 , et voir comment vous vous comparez aux autres.
Il y a beaucoup d'indications sur les manuels de statistiques mathématiques dans les réponses. J'aimerais ajouter comme sujets pertinents:
Disclaimer: Je ne suis pas un statisticien, ce ne sont que mes 2cents
la source
ET Jaynes "Théorie des probabilités: la logique de la science: principes et applications élémentaires, Vol 1", Cambridge University Press, 2003 est quasiment une lecture incontournable pour la partie bayésienne de la statistique, à peu près au bon niveau. Je suis impatient de recevoir des recommandations pour le côté fréquentiste (j'ai beaucoup de monographies, mais très peu de bons textes généraux).
la source
Je viens d'une formation en informatique spécialisée dans l'apprentissage automatique. Cependant, j'ai vraiment commencé à comprendre (et surtout à appliquer) les statistiques après avoir suivi un cours de reconnaissance de modèle à l'aide du livre de Bishop, https://www.microsoft.com/en-us/research/people/cmbishop/#!prml-book.
voici quelques diapositives de cours du MIT:
http://www.ai.mit.edu/courses/6.867-f03/lectures.html
Cela vous donnera simplement l’arrière-plan (+ du code matlab) pour utiliser les statistiques pour de vrais problèmes de travail et est certainement plus du côté appliqué.
Pourtant, cela dépend fortement de ce que vous voulez faire de vos connaissances. Pour obtenir une mesure de votre qualité, vous pouvez parcourir les logiciels de cours ouverts de certaines universités pour des cours de statistiques avancées, afin de vérifier si vous connaissez les sujets abordés. Juste mon 5 cent.
la source
Je pense que Stanford fournit les meilleures ressources en matière de flexibilité. Ils ont même un cours d’apprentissage automatique en ligne qui vous fournirait une base de connaissances respectable en matière de conception d’algorithmes en R. Recherchez-le sur Google et il vous redirigera vers leur page Lagunita où ils proposent des cours intéressants, la plupart leur être libre. J'ai les livres de Tibshirani, Introduction à l'apprentissage statistique »et« Éléments d'apprentissage statistique »au format PDF. Ces deux ressources constituent d'excellentes ressources.
Étant donné que vous êtes mathématicien, je vous conseillerais néanmoins de ne pas suivre la procédure accélérée, car cela ne vous fournirait pas une base solide qui pourrait vous être très utile à l'avenir si vous commençiez à faire un apprentissage en machine sérieux. Traiter les statistiques comme une branche des mathématiques pour obtenir des informations à partir de données, ce qui nécessite du travail. En dehors de cela, il existe des tonnes de ressources en ligne, Johns Hopkins fournit des informations similaires à celles de Stanford. Bien que l'expérience paie toujours, un titre respectable renforcera toujours cette base. Vous pouvez également penser aux champs spécifiques que vous souhaitez entrer; J'entends par là si vous souhaitez vous lancer dans l'analyse de texte ou appliquer vos compétences en mathématiques et en statistiques à la finance. J'arrive dans cette dernière catégorie, j'ai donc un diplôme en économétrie où nous avons étudié la finance et les statistiques. Une combinaison peut toujours être très bonne.
la source