J'ai suivi suffisamment de cours de statistiques pendant mes années scolaires et à l'université. J'ai une bonne compréhension des concepts tels que CI, valeurs p, interprétation de la signification statistique, tests multiples, corrélation, régression linéaire simple (avec les moindres carrés) (modèles linéaires généraux) et tous les tests d'hypothèse. On m'avait présenté une grande partie des premiers jours, principalement mathématiquement. Et récemment, avec l'aide du livre Intuitive Biostatistics, j'ai compris et une compréhension sans précédent de la théorie conceptuelle actuelle, je crois.
Maintenant, ce qui me manque, c'est la compréhension de l'ajustement des modèles (estimation des paramètres au modèle) et similaires. En particulier, des concepts tels que l'estimation du maximum de vraisemblance, les modèles linéaires généralisés , les approches bayésiennes des statistiques inférentielles me semblent toujours étrangers. Il n'y a pas suffisamment d'exemples ou de didacticiels ou conceptuellement solides, comme on en trouverait sur des modèles probabilistes simples ou sur d'autres sujets (de base) sur Internet.
Je suis bioinformaticien et je travaille sur des données RNA-Seq qui traitent du nombre de lectures brutes pour trouver, disons, l'expression génique (ou l'expression génique différentielle). De mon expérience, même si je ne suis pas familier avec les modèles statistiques, je suis capable de comprendre la raison d'une hypothèse de distribution de poisson et de binômes négatifs et ainsi de suite .. Mais certains articles traitent de modèles linéaires généralisés et estiment un MLE etc. qui Je crois avoir le bagage nécessaire pour comprendre.
Je suppose que ce que je demande, c'est une approche que certains experts parmi vous jugent utile et (un) livre (s) qui m'aide à saisir ces concepts de manière plus intuitive (pas seulement des mathématiques rigoureuses, mais une théorie soutenue par des mathématiques). Comme je vais surtout les appliquer, je serais satisfait (pour le moment) de comprendre ce qui est quoi et plus tard, je pourrai revenir à des preuves mathématiques rigoureuses ... Quelqu'un a-t-il des recommandations? Cela ne me dérange pas d'acheter plus d'un livre si les sujets que j'ai demandés sont en effet dispersés pour être couverts dans un livre.
Merci beaucoup!
Réponses:
Vous trouverez tout ce qui n'est pas bayésien que vous avez demandé à ce sujet Stratégies de modélisation de régression de Frank Harrell . Je laisserais les recommandations bayésiennes à des gens plus avertis (bien que j'ai Gelman, Carlin, Stern et Rubin , ainsi que Gilks, Richardson et Speigelhalter , sur ma bibliothèque). Il devrait y avoir quelques livres biostatistiques bayésiens sur le marché.
Mise à jour: McCullach et Nelder (1989) est un livre classique sur les GLM, bien sûr. C'était révolutionnaire pour l'époque, mais je le trouve plutôt ennuyeux, franchement. En outre, il ne couvre pas les ajouts ultérieurs comme les diagnostics résiduels, les modèles gonflés à zéro ou les extensions multiniveaux / hiérarchiques. Hardin et Hilbe (2007) couvrent en détail certains de ces nouveaux éléments avec des exemples pratiques dans Stata (où les GLM et les extensions sont très bien implémentés; Hardin travaillait chez Stata Corp. à écrire bon nombre de ces commandes, ainsi qu'à contribuer à la estimateur sandwich).
la source
Je recommanderais de suivre deux livres:
la source