L'apprentissage statistique et ses résultats sont actuellement omniprésents en sciences sociales. Il y a quelques mois, Guido Imbens a déclaré: "LASSO est le nouvel OLS".
J'ai un peu étudié le Machine Learning et je sais que son objectif principal est la prédiction. Je suis également d'accord avec la distinction de Leo Breiman entre deux cultures de statistiques. Donc, de mon point de vue, la causalité s'oppose dans une certaine mesure à la prédiction.
Étant donné que les sciences essaient généralement d'identifier et de comprendre les relations de causalité, l'apprentissage automatique est-il utile pour atteindre cet objectif? En particulier, quels sont les avantages de LASSO pour l'analyse causale?
Y a-t-il des chercheurs (et des articles) traitant de ces questions?
la source
Réponses:
Je ne les connais pas tous, j'en suis sûr, alors j'espère que cela ne dérangera personne si nous faisons ce style wiki.
Un élément important est cependant que le LASSO est biaisé (source, Wasserman en cours, désolé), ce qui, bien qu'acceptable dans la prédiction, est un problème d'inférence causale. Si vous voulez la causalité, vous la voulez probablement pour la science, donc vous n'essayez pas seulement d'estimer les paramètres les plus utiles (qui se produisent étrangement pour bien prédire), vous essayez d'estimer les paramètres VRAI (!).
la source