Il existe un podcast NPR appelé Intelligence Squared. Chaque épisode est la diffusion d'un débat en direct sur une déclaration litigieuse telle que "Le 2e amendement n'est plus pertinent" ou "L'action positive sur les campus universitaires fait plus de mal que de bien". Quatre représentants débattent - deux pour la motion et deux contre.
Pour déterminer quelle équipe gagne, le public est sondé avant et après le débat. L'équipe qui a gagné le plus en termes de pourcentage absolu est considérée comme gagnante. Par exemple:
For Against Undecided
Before 18% 42% 40%
After 23% 49% 28%
Winner: Against team -- The motion is rejected.
Intuitivement, je pense que cette mesure du succès est biaisée et je me demande comment on pourrait interroger le public pour déterminer le gagnant de manière équitable.
Trois problèmes que je vois immédiatement avec la méthode actuelle:
Aux extrêmes, si un côté commence avec un accord à 100%, ils ne peuvent que nouer ou perdre.
S'il n'y a pas d'indécis, alors le côté avec le moins d'accord initial peut être considéré comme ayant une plus grande taille d'échantillon à partir de laquelle puiser.
Le côté indécis n'est pas susceptible d'être vraiment indécis. Si nous supposons que les deux côtés sont également polarisés, il semble que notre croyance antérieure concernant la population indécise devrait être si chacun était forcé de prendre parti .
Étant donné que nous devons nous fier aux sondages d'audience, existe-t-il un moyen plus juste de juger qui gagne?
Réponses:
Vos préoccupations sont bien fondées. Malheureusement, il existe de nombreuses façons objectives et défendables de régler ce problème et elles peuvent entrer en conflit les unes avec les autres. L'analyse suivante fournit un cadre pour décider de la manière dont vous souhaitez évaluer le résultat et montre à quel point vos conclusions dépendent des hypothèses que vous faites sur la dynamique de la situation.
Nous avons peu ou pas de contrôle sur le public initial. Il pourrait ne pas représenter une population plus importante (comme tous les téléspectateurs) qui nous intéresse davantage. Par conséquent, le nombre absolu d'opinions est peu pertinent: ce qui compte, ce sont les taux auxquels les gens pourraient changer d'avis. (À partir de ces taux, nous pourrions estimer la manière dont la population d'écoute pourrait changer, compte tenu des informations sur leurs opinions initiales, même lorsque les proportions d'opinions dans l'audience d'écoute diffèrent de l'audience de studio interrogée.)
Le résultat consiste donc en six changements d'opinion possibles et six taux de changement associés:
Ceux "pour", que je vais indexer avec peuvent changer d'avis et se retrouver soit contre (avec l'index ) au taux ou indécis (avec l'index ) au taux .2 a 12 3 a 131 , 2 une12 3 une13
Ceux "contre" peuvent changer d'avis en "pour" au taux ou "indécis" au taux . un 23une21 une23
Les indécis peuvent changer d'avis sur "pour" au taux ou "contre" au taux a 32 .une31 une32.
Définissez , pour la proportion de personnes de l'indice ne changent pas d'avis. i = 1 , 2 , 3 , iuneje je i = 1 , 2 , 3 , je
Les colonnes de la matrice contiennent des nombres non négatifs qui doivent s'ajouter à l'unité (en supposant que tous ceux qui répondent au sondage initial répondent également au dernier). Cela laisse six valeurs indépendantes à déterminer en fonction de la transition de la distribution initiale dans l'audience, , à la distribution finale . Il s'agit d'un système sous-déterminé d'équations linéaires (contraintes), laissant une énorme flexibilité pour dériver une solution. Regardons trois solutions.x = ( 0,18 , 0,42 , 0,40 ) y = ( 0,23 , 0,49 , 0,28 ) = A xA=(aij) x=(0.18,0.42,0.40) y=(0.23,0.49,0.28)=Ax
Solution 1: moindre changement
On pourrait demander que la matrice de transition soit aussi petite que possible dans un certain sens. Une façon consiste à minimiser la proportion totale de personnes qui changent d'opinion. Ceci est accompli dans l'exemple avec la solutionA
Autrement dit, des indécis se sont retrouvés pour, d'entre eux se sont retrouvés contre, et aucun des fors ou contre d'origine n'a changé d'avis. Qui a gagné? Les contre, évidemment, parce que le débat a persuadé une plus grande partie des indécis de se contenter de l'opinion "contre".17,5 %12.5% 17.5%
Ce modèle serait approprié lorsque vous croyez que les factions initiales sont endurcies à leurs opinions et que les seules personnes susceptibles de changer d'avis sont parmi celles initialement déclarées indécises.
Solution 2: les moindres carrés
Une solution mathématiquement simple consiste à trouver la matrice dont la norme au carré est aussi petit que possible: cela minimise la somme des carrés des neuf probabilités de transition (qui incluent l' représentant les proportions qui ne changent pas d'avis). Sa solution (arrondie à deux décimales) estL 2 | | A | | 2 2 = t r ( A ′ A ) a i iA L2 ||A||22=tr(A′A) aii
En comparant les rangées, nous voyons que bien que du côté "contre" aient été persuadés de se convertir en "pour" (et étaient suffisamment confus pour devenir indécis), du côté "pour" étaient entièrement convertis (et supplémentaires ont été confondus). Les indécis d'origine avaient tendance à se convertir du côté «contre» ( contre ). Désormais, "contre" est clairement le vainqueur.27 % 41 % 31 % 50 % 22 %22% 27% 41% 31% 50% 22%
La solution des moindres carrés pose généralement beaucoup de changements dans chaque groupe. (Sous réserve des contraintes du problème, il essaie de rendre les changements tous égaux à .) Il est difficile de déterminer s'il correspond à une représentation réaliste de la population, mais il présente une image mathématiquement possible de ce qui s'est passé. pendant le débat.1/3
Solution 3: les moindres carrés pénalisés
Pour contrôler et limiter la vitesse à laquelle les gens changent d'opinion, pénalisons l'objectif des moindres carrés en incluant des termes qui ne favorisent aucun changement d'opinion. Ce sont les termes sur la diagonale de . On pourrait supposer qu'il est plus difficile de changer l'opinion de quelqu'un qui n'est pas indécis, il serait donc bon de pondérer ce dernier. À cette fin, introduisez des poids positifs et trouvez pour lequel est minimisé.A ωi A
Par exemple, diminuons de 50% les indécis en sélectionnant les poids . La solution (arrondie) estω=(1,1,1/2)
Cette solution est intermédiaire entre les deux premières: une faible proportion des parties engagées ont changé d'avis ou sont devenues indécises tandis que des indécis ont pris une décision ( pour et contre). Encore une fois, cependant, les résultats favorisent clairement la faction "contre".40% 17% 23%
Sommaire
Dans ce modèle de transition de changement d'opinion, la plupart des méthodes de solution indiquent une victoire pour le côté «contre» dans cet exemple particulier. En l'absence d'opinions fortes sur la dynamique du changement, cela suggère que le camp "contre" a gagné.
Dans d'autres circonstances, certaines méthodes de solution peuvent indiquer un gagnant et d'autres méthodes de solution un autre gagnant. Par exemple, dans la transition de à il semble naïvement que les "fors" ont remporté une victoire spectaculaire: leur nombre est passé de à tandis que la faction "contre" est passée de à . Cependant, la solution des moindres carrés (arrondis) suggère au moins qu'il existe un moyen pour que cela se produise dans lequel le débat a légèrement favorisé l'autre côté! Il est(.20,.60,.20) (.30,.40,.30) 20% 30% 40% 30%
Ici, des "fors" sont passés de l'autre côté alors que seulement des "contre" ont changé d'avis contraire. De plus, un peu plus d'indécis contre ) se sont prononcés "contre" plutôt que pour. Bien que leur nombre dans ce public ait diminué, nous avons une situation (qui rappelle le Paradoxe de Simpson ) dans laquelle la faction "contre" a clairement gagné le débat!36% 29% (36%) 32%
Commentaires supplémentaires
Si les sondages d'opinion pouvaient suivre les individus avant et après, nous pourrions estimer l'ensemble de la matrice de transition et il y aurait beaucoup moins d'incertitude quant aux effets du débat sur l'opinion publique.A
Les trois méthodes de solution illustrées ici ne sont pas les seules possibles: d'autres pourraient être trouvées en pondérant les coefficients de individuellement, par exemple. Cependant, ils couvrent un large éventail de possibilités, allant de la solution parcimonieuse de «moindre changement» à la solution agressive des moindres carrés. Ainsi, l'exploration de la gamme de solutions obtenues avec ces trois méthodes devrait donner une bonne indication de ce qui pourrait raisonnablement être réalisé. S'ils s'entendent tous sur le résultat, cela ne devrait faire aucun doute.A
la source
La question du biais semble ici être qu'une partie peut être favorisée pour gagner même si elle n'a pas de meilleures compétences de débat, plutôt que le concept statistique de biais d'un estimateur. Une approche naturelle serait de s'attaquer directement à ce problème: utiliser les données des concours précédents pour ajuster un modèle de régression et définissez la règle gagnante en fonction du sondage avant débat afin que la probabilité prédictive de gagner soit de
Idées pour construire un modèle prédictif
Au départ, je n'avais en tête qu'un modèle de "boîte noire" des nombres après sondage en fonction des nombres avant sondage et du bruit. Cependant, une meilleure approche pourrait être d'emprunter l'idée de whuber de considérer les probabilités de transition. L'approche la plus simple (mais peut-être pas réaliste) serait de considérer les probabilités de transition comme indépendantes des chiffres du sondage avant le débat. Par exemple, supposons que les probabilités de transition sont tirées des distributions de Dirichlet: Paaaaff=aaaafu=aau
Étant donné les distributions postérieures ou les estimations ponctuelles de s, et la distribution des individus dans le courant avant le scrutin (que je suppose maintenant indépendant des probabilités de transition), il est simple de simuler la distribution des nombres après le débat, puis choisissez la médiane, par exemple, pour / contre-ratio comme seuil de gain.a
la source