Issu d'une formation en sciences sociales et en épidémiologie, mes collègues ont été formés à la régression des moindres carrés, à la régression logistique et à l'analyse de survie. Ils aiment voir des intervalles de confiance à 95% et des valeurs de p avec les coefficients des paramètres, et se méfient des outils prédictifs plus récents tels que les réseaux de neurones, CART, l'ensachage et le boosting, ainsi que des techniques de régression pénalisées.
8
Réponses:
Je vais peser en tant qu'épidémiologiste.
Premièrement, je vous déconseille fortement de supposer qu'il s'agit simplement d'inertie, que ce soit sous la forme d'une discipline ne voulant pas adopter de nouvelles techniques, ou que vos collègues perdent le contact avec les nouveaux développements statistiques. Vous pouvez vous rendre à des conférences universitaires sur l'épidémiologie où des travaux nouveaux et très sophistiqués sur le plan méthodologique sont en cours, et vous ne trouverez toujours pas nécessairement grand-chose sur la modélisation prédictive.
L'indice est dans le nom. Modélisation prédictive .
L'épidémiologie, en tant que domaine, n'est pas particulièrement intéressée par la prédiction pour elle-même. Au lieu de cela, il se concentre sur le développement d'explications étiologiques pour les modèles de maladie observés dans une population. Les deux sont liés, mais distincts, ce qui conduit souvent à une sorte de méfiance philosophique à l'égard des techniques de classification et de prédiction plus modernes qui tentent purement de maximiser l'impact prédictif d'un modèle. À l'extrême, les personnes estiment que la sélection des variables doit être effectuée principalement en utilisant quelque chose comme un graphique acyclique dirigé, ce qui pourrait être considéré comme l'opposé de l'orientation de la modélisation prédictive.
Il en résulte que cela ne fait pas partie de leurs antécédents, que ce n'est pas quelque chose qu'ils rencontrent beaucoup dans la littérature et, pour être parfaitement franc, il est fort probable que leur exposition à cela ait été faite par des personnes qui ne comprennent pas réellement les problèmes qu'ils essaient résoudre.
Ceci, dans les commentaires, est un parfait exemple:
Presque tous les épidémiologistes que je connais, si vous les faisiez choisir, choisiraient une réduction du biais plutôt qu'une augmentation de la précision.
Cela ne veut pas dire qu'il ne soit jamais évoqué. Il y a des moments où des modèles prédictifs sont utilisés - souvent dans des cas cliniques où la prédiction des résultats de ce patient particulier est d'un intérêt considérable, ou la détection d'une épidémie, où ces techniques sont utiles parce que nous ne savons pas ce qui s'en vient et ne pouvons pas faire d'étiologie arguments. Ou lorsque la prédiction est vraiment l'objectif - par exemple, dans de nombreux modèles d'estimation d'exposition. Ils sont juste un peu de niche dans le domaine.
la source