Techniques d'exploration de données dans la campagne d'Obama

10

Je suis tombé sur cet article sur l'équipe d'exploration de données dans la campagne de réélection d'Obama. Malheureusement, l'article est très flou sur le mécanisme réel des algorithmes statistiques. Cependant, il semblait que les techniques générales soient connues en sciences sociales et politiques. Étant donné que ce n'est pas mon domaine d'expertise, quelqu'un peut-il me diriger vers la littérature (aperçu) sur ce type de techniques?

fabee
la source

Réponses:

16

Ce domaine est appelé microtargeting (si vous souhaitez le rechercher sur Google). Les campagnes sont assez secrètes au sujet de leurs outils et procédures, donc à ma connaissance il n'y a pas beaucoup de travaux publiés, sauf le ciblage politique de Hal Malchow (2008) ou Green & Gerber (2008) Sortez le vote: comment augmenter la participation électorale (ce dernier traite davantage sur les aspects des sciences sociales comme les publicités efficaces, etc.).

Sur des questions plus techniques, la littérature est encore plus rare, mais voir, par exemple, Murray & Scime (2010) , le document d'analyse politique d' Imai & Strauss (2011) ( post-impression ) ou le récent document Annals of Applied Statistics de Rusch, Lee, Hornik, Jank & Zeileis (2013) ( post-impression ). Ce qu'ils ont tous en commun, c'est qu'ils utilisent des techniques d'exploration de données, principalement basées sur des arbres.

Murray & Scime utilise des arbres de classification standard comme CART.

Rusch et al. utiliser des arbres de classification, des modèles logistiques et un hybride d'arbres et de régression logistique. Ils utilisent également (entre autres) des forêts aléatoires, des réseaux de neurones, des machines à vecteurs de support et des arbres de régression additive bayésienne pour comparer avec leurs hybrides d'arbres, comme cela est décrit dans la duplique de l'article . Leurs arbres hybrides fonctionnent à égalité avec les autres méthodes de leurs ensembles de données et offrent une meilleure interprétabilité (nous partageons également leur code et leurs données).

Imai & Strauss est intéressant dans la mesure où ils présentent un cadre théorique de décision complet pour une planification optimale des campagnes, et pas seulement des outils de microtargeting comme les autres. Ainsi, ils se concentrent beaucoup sur les aspects de la recherche opérationnelle sur la façon de tirer le meilleur parti de chaque dollar investi dans une campagne. Dans l'aspect de leur cadre où ils utilisent des techniques statistiques pour le micro-ciblage et l'estimation de la participation, ils s'appuient à nouveau sur des arbres de classification.

Ainsi, il semble y avoir un certain consensus sur le fait que l'utilisation de méthodes basées sur les arbres fonctionne bien dans ce domaine.

Momo
la source