Quels sujets de statistiques fréquentistes devrais-je connaître avant d'apprendre les statistiques bayésiennes?

8

Je me demandais s'il y avait un sous-ensemble de sujets de statistiques fréquentistes que l'on devrait connaître avant de commencer à apprendre les statistiques bayésiennes. Une fois que j'ai lu qu'il semble que les deux tendances sont antagonistes l'une de l'autre; comme par exemple l'analyse fréquentiste est fortement basée sur des hypothèses (hypothèses) qui sont faites sur des données observées; tandis que les statistiques bayésiennes reposent davantage sur la construction d'un modèle antérieur pour en déduire des informations postérieures.

Dans tous les cas, quels sujets de statistiques fréquentistes ou générales devrais-je connaître avant de me lancer dans les statistiques bayésiennes?

Layla
la source
"antagonistes les uns des autres" -> "antagonistes les uns des autres"?
Faheem Mitha

Réponses:

6

Il n'est pas nécessaire de l'appeler matériel fréquentiste, plutôt matériel issu des probabilités et des statistiques en général.

Voici quelques exemples de connaissances antérieures qui, à mon avis, seraient utiles:

  1. Quelles sont les densités, les distributions (conditionnelles), les attentes, etc.?
  2. Certaines familles de distribution spécifiques (Bêta, normal, uniforme, etc.)
  3. Vous voudrez probablement appliquer des méthodes bayésiennes à des données réelles, donc des logiciels statistiques. Mon préféré: R
  4. Quelques mathématiques: Algèbre matricielle, intégration, ...
  5. De plus, il pourrait être utile de se familiariser avec certains modèles statistiques, tels que le modèle linéaire .y=Xβ+u
  6. Compte tenu de l'importance accordée à la probabilité, il ne peut pas faire de mal d'avoir entendu parler de la probabilité maximale avant

Le paradigme bayésien étant subjectif, je suis sûr que d'autres seront en désaccord avec ou ajouteront à cette liste ...

Christoph Hanck
la source
Donc, votre réponse à la question "quels sujets fréquentistes devrais-je apprendre" est fondamentalement "aucune"? Parce que vous avez explicitement
omis
1
Eh bien, je dois dire que je n'ai jamais rencontré (ou du moins parlé avec) quelqu'un qui a appris les statistiques bayésiennes avant les statistiques fréquentistes, mais ce serait mon avis, oui, car en effet, ces sujets sont relativement moins importants d'un point de vue bayésien . Bien sûr, il existe des résultats sur les tests d'hypothèse bayésienne et les propriétés fréquentistes des estimateurs bayésiens (tels que la non-biais). Mais je dirais que ce n'est pas nécessaire pour commencer à apprendre, comme vous l'avez demandé.
Christoph Hanck
10

Vous n'avez pas à apprendre les statistiques «fréquentistes» ou bayésiennes dans un ordre particulier. Vous devez d'abord apprendre tout ce dont vous avez besoin pour comprendre les résultats dans votre domaine, puis vous devez comprendre les relations mathématiques (calcul) et philosophiques (interprétation) entre les techniques. Il n'y a pas d'enseignant comme des données réelles, c'est donc toujours la première préoccupation.

Il n'y a aucune raison particulière de ne pas les apprendre en même temps. Il est utile de connaître l'essentiel du calcul pour Bayes, qui est probablement d'où sa réputation d'être "plus difficile", mais je ne dirais pas qu'il est nécessaire maintenant que nous avons un logiciel bien meilleur qu'il y a quelques années. Si vous êtes nouveau dans les statistiques et que vous voulez jouer avec le cadre fréquentiste et bayésien, je peux recommander le nouveau logiciel JASP . Si vous aimez R, le package BayesFactor est solide.

Si vous voulez partir du fréquentisme, je vous suggère de savoir ce qui suit:

  1. L'interprétation complète et exacte de tous les éléments suivants.
  2. Relation entre les valeurs de p, les intervalles de confiance, la taille des échantillons, la puissance et les taux d'erreur.
  3. La relation entre les tests Z, les tests t, l'analyse de la variance et la régression linéaire.
  4. La relation entre la régression linéaire et la régression non linéaire, ainsi que les tests paramétriques et non paramétriques.
  5. La relation entre les variables muettes, les contrastes et le codage des effets.
  6. L'interprétation complète et exacte de tous les éléments précédents.

Cela semble beaucoup, mais ces choses sont toutes liées de manière fondamentale. Chaque inférence se résume à la même chose essentielle: nous voulons faire des prédictions correctes sur les données non observées, sur la base d'un modèle de données observées, en comparant deux ou plusieurs modèles. Nous le faisons en calculant notre confiance, pour une certaine définition de la «confiance», dans deux modèles ou plus et en prenant le rapport. À sa base, c'est tout.

Une grande partie de la controverse concerne vraiment la formalisation de la «confiance», et bien que ce soit une discussion importante que je suis heureux d'avoir, ce n'est pas quelque chose dont vous devez être conscient en ce moment. Dans le cadre fréquentiste, des mesures spéciales sont prises pour créer un modèle nul implicite à mettre dans le dénominateur, tandis que dans le cadre bayésien, les deux modèles sont énoncés explicitement, mais la production réelle et les interprétations pour les deux cadres impliquent un degré substantiel de subjectivité. Pour le fréquentisme, c'est dans la construction du maximum de vraisemblance et le choix du taux d'erreur, et pour les Bayésiens, c'est dans le passé. À mon avis, tout le monde devrait apprendre les deux.

Christian Hummeluhr
la source