J'ai récemment obtenu mon diplôme de maîtrise en modélisation médicale et biologique, accompagné de mathématiques d'ingénierie en arrière-plan. Même si mon programme d'éducation comprenait une quantité importante de cours sur les statistiques mathématiques (voir ci-dessous pour une liste), que j'ai réussi avec des notes assez élevées, je finis souvent par perdre complètement à regarder à la fois la théorie et les applications des statistiques. Je dois dire que par rapport aux mathématiques "pures", les statistiques n'ont vraiment pas de sens pour moi. En particulier, les notations et le langage utilisés par la plupart des statisticiens (y compris mes anciens professeurs) sont dérangeants et presque aucune des ressources que j'ai vues jusqu'à présent (y compris wikipedia) n'avait d'exemples simples auxquels on pourrait facilement se rapporter et associer à la théorie donnée. ..
Ceci étant l'arrière-plan; Je réalise également l'amère réalité que je ne peux pas faire carrière en tant que chercheur / ingénieur sans une solide maîtrise des statistiques, en particulier dans le domaine de la bioinformatique.
J'espérais pouvoir obtenir des conseils de statisticiens / mathématiciens plus expérimentés. Comment puis-je surmonter ce problème que j'ai mentionné ci-dessus? Connaissez-vous de bonnes ressources? tels que des livres, des e-books, des cours ouverts (via iTunes ou OpenCourseware par exemple) etc.
EDIT: Comme je l'ai mentionné, je suis assez biaisé (négativement) envers la majorité de la littérature sous le titre général de statistiques, et comme je ne peux pas acheter un certain nombre de livres de cours importants (et coûteux) par branche de statistiques, ce dont j'aurais besoin en termes de livre est quelque chose de similaire à ce que Tipler & Mosca est pour la physique, mais plutôt pour les statistiques.
Pour ceux qui ne connaissent pas Tipler; c'est un grand manuel qui couvre une grande majorité des sujets que l'on pourrait rencontrer pendant les études supérieures, et les présente chacun de l'introduction de base à un peu plus en détail. Fondamentalement, un livre de référence parfait, acheté lors de ma première année à l'université, toujours l'utiliser de temps en temps.
Les cours que j'ai suivis en statistiques:
- un grand cours d'introduction,
- processus stochastiques stationnaires,
- Processus de Markov,
- Méthodes de Monte Carlo
- Analyse de survie
Connaissez-vous l'analyse des données bayésiennes (par Gelman, Carlin, Stern et Rubin)? C'est peut-être ce dont vous avez besoin d'une dose.
la source
Tous les problèmes de statistiques se résument essentiellement à 4 étapes (que j'ai empruntées à la réponse @whuber sur une autre question ):
Estimez le paramètre.
Évaluez la qualité de cette estimation.
Explorez les données.
Évaluez l'ajustement.
Vous pouvez échanger le paramètre de mot avec le modèle de mot .
Les livres de statistiques présentent généralement les deux premiers points pour diverses situations. Le problème que chaque application du monde réel nécessite une approche différente, donc un modèle différent, donc une grande partie des livres finissent par cataloguer ces différents modèles. Cela a pour effet indésirable qu'il est facile de se perdre dans les détails et de manquer la vue d'ensemble.
Le grand livre d'images que je recommande vivement est les statistiques asymptotiques . Il donne un traitement rigoureux du sujet et est mathématiquement "pur". Bien que son titre mentionne les statistiques asymptotiques, le grand secret inconnu est que la majorité des méthodes statistiques classiques sont essentiellement basées sur des résultats asymptotiques.
la source
Je pense que la chose la plus importante ici est de développer une intuition sur les statistiques et certains concepts statistiques généraux. La meilleure façon de procéder est peut-être d'avoir un domaine que vous pouvez "posséder". Cela peut fournir une boucle de rétroaction positive où la compréhension du domaine vous aide à mieux comprendre les statistiques sous-jacentes, ce qui vous aide à mieux comprendre le domaine, etc.
Pour moi, ce domaine était les statistiques de baseball. J'ai compris qu'un batteur qui va 3 pour 4 dans un match n'est pas un "vrai" frappeur de .750. Cela permet de comprendre le point plus général selon lequel les données d'échantillon ne sont pas identiques à la distribution sous-jacente. Je sais aussi qu'il est probablement plus proche d'un joueur moyen que d'un frappeur de .750, donc cela aide à comprendre des concepts comme la régression à la moyenne. De là, je peux arriver à une inférence bayésienne à part entière où ma distribution de probabilité antérieure avait une moyenne de celle du joueur de baseball moyen, et j'ai maintenant 4 nouveaux échantillons avec lesquels mettre à jour ma distribution postérieure.
Je ne sais pas ce que ce domaine est pour vous, mais je suppose qu'il serait plus utile qu'un simple manuel. Les exemples aident à comprendre la théorie, ce qui aide à comprendre les exemples. Un manuel avec des exemples est bien, mais à moins que vous puissiez faire ces exemples "à vous", je me demande si vous en obtiendrez assez.
la source
En tant qu'alternative aux stratégies de modélisation de régression et pour une approche plus pratique, les modèles statistiques linéaires appliqués sont très bons de mon point de vue.
la source
Tout le monde apprend différemment, mais je pense qu'il est sûr de dire que des exemples, des exemples, des exemples, aident beaucoup en statistiques. Ma suggestion serait d'apprendre R (juste les bases suffisent pour aider beaucoup) et ensuite vous pouvez essayer n'importe quel exemple jusqu'à ce que vos yeux saignent. Vous pouvez le trier, l'ajuster, le tracer, vous le nommez. Et, puisque R est orienté vers les statistiques, en apprenant R, vous apprendrez des statistiques. Les livres que vous avez énumérés peuvent alors être attaqués du point de vue du «montre-moi».
Étant donné que R est gratuit et que beaucoup de sources sont gratuites, tout ce que vous devez investir est votre temps.
http://www.mayin.org/ajayshah/KB/R/index.html
http://math.illinoisstate.edu/dhkim/rstuff/rtutor.html
http://www.cyclismo.org/tutorial/R/
http://www.stat.pitt.edu/stoffer/tsa2/R_time_series_quick_fix.htm
http://www.statmethods.net/about/books.html
Il existe de nombreux bons livres sur R que vous pouvez acheter, en voici un que j'ai utilisé:
http://www.amazon.com/Introductory-Statistics-R-Peter-Dalgaard/dp/0387954759
Modifier ============
J'ai oublié d'ajouter quelques liens. Si vous utilisez Windows, un bon éditeur pour alimenter R est Tinn-R (quelqu'un d'autre peut ajouter des liens pour les éditeurs sur un Mac ou Linux).
http://www.sciviews.org/Tinn-R/
http://cran.r-project.org/web/packages/TinnR/
la source
Personnellement, j'ai adoré ce qui avait un très bon mélange de théorie et d'application (avec beaucoup d'exemples). C'était un bon match avec casella et berger pour une approche plus théorique. Et pour un large aperçu de ce pinceau .
la source