Je me demandais s'il y avait un sous-ensemble de sujets de statistiques fréquentistes que l'on devrait connaître avant de commencer à apprendre les statistiques bayésiennes. Une fois que j'ai lu qu'il semble que les deux tendances sont antagonistes l'une de l'autre; comme par exemple l'analyse fréquentiste est fortement basée sur des hypothèses (hypothèses) qui sont faites sur des données observées; tandis que les statistiques bayésiennes reposent davantage sur la construction d'un modèle antérieur pour en déduire des informations postérieures.
Dans tous les cas, quels sujets de statistiques fréquentistes ou générales devrais-je connaître avant de me lancer dans les statistiques bayésiennes?
bayesian
frequentist
Layla
la source
la source
Réponses:
Il n'est pas nécessaire de l'appeler matériel fréquentiste, plutôt matériel issu des probabilités et des statistiques en général.
Voici quelques exemples de connaissances antérieures qui, à mon avis, seraient utiles:
Le paradigme bayésien étant subjectif, je suis sûr que d'autres seront en désaccord avec ou ajouteront à cette liste ...
la source
Vous n'avez pas à apprendre les statistiques «fréquentistes» ou bayésiennes dans un ordre particulier. Vous devez d'abord apprendre tout ce dont vous avez besoin pour comprendre les résultats dans votre domaine, puis vous devez comprendre les relations mathématiques (calcul) et philosophiques (interprétation) entre les techniques. Il n'y a pas d'enseignant comme des données réelles, c'est donc toujours la première préoccupation.
Il n'y a aucune raison particulière de ne pas les apprendre en même temps. Il est utile de connaître l'essentiel du calcul pour Bayes, qui est probablement d'où sa réputation d'être "plus difficile", mais je ne dirais pas qu'il est nécessaire maintenant que nous avons un logiciel bien meilleur qu'il y a quelques années. Si vous êtes nouveau dans les statistiques et que vous voulez jouer avec le cadre fréquentiste et bayésien, je peux recommander le nouveau logiciel JASP . Si vous aimez R, le package BayesFactor est solide.
Si vous voulez partir du fréquentisme, je vous suggère de savoir ce qui suit:
Cela semble beaucoup, mais ces choses sont toutes liées de manière fondamentale. Chaque inférence se résume à la même chose essentielle: nous voulons faire des prédictions correctes sur les données non observées, sur la base d'un modèle de données observées, en comparant deux ou plusieurs modèles. Nous le faisons en calculant notre confiance, pour une certaine définition de la «confiance», dans deux modèles ou plus et en prenant le rapport. À sa base, c'est tout.
Une grande partie de la controverse concerne vraiment la formalisation de la «confiance», et bien que ce soit une discussion importante que je suis heureux d'avoir, ce n'est pas quelque chose dont vous devez être conscient en ce moment. Dans le cadre fréquentiste, des mesures spéciales sont prises pour créer un modèle nul implicite à mettre dans le dénominateur, tandis que dans le cadre bayésien, les deux modèles sont énoncés explicitement, mais la production réelle et les interprétations pour les deux cadres impliquent un degré substantiel de subjectivité. Pour le fréquentisme, c'est dans la construction du maximum de vraisemblance et le choix du taux d'erreur, et pour les Bayésiens, c'est dans le passé. À mon avis, tout le monde devrait apprendre les deux.
la source