Il y a eu une élection générale où j'habite hier et la chaîne de télévision a commencé à annoncer les gagnants bien avant l'ouverture de tous les scrutins.
Ils ont bien fonctionné sur tous les plans, et je ne suis pas vraiment surpris qu'ils l'aient fait. Je sais que les statistiques sont absolument viables. Pourtant, je suis curieux. En supposant:
- nous avons ouvert sur j bulletins de vote;
- nous avons candidats dont les scores sont en cours c 1 , c 2 , c 3 , . . . c n ;
Comment calculer la certitude avec laquelle le candidat principal est le gagnant?
Réponses:
La principale difficulté dans la pratique n'est pas l'incertitude statistique qu'une séquence de coups de chance aurait donné à un candidat plus de voix. La principale difficulté, d'un ordre de grandeur ou plus, est que les bulletins de vote ouverts ne sont presque jamais un échantillon impartial des suffrages exprimés. Si vous ignorez cet effet, vous obtenez la fameuse erreur "Dewey Defeats Truman", qui s'est produite avec un grand échantillon biaisé.
Dans la pratique, les électeurs qui favorisent un candidat par rapport à un autre ne sont pas répartis également par région, selon qu'ils travaillent de jour ou s'ils seraient déployés à l'étranger et voteraient donc par bulletin de vote par correspondance. Ce ne sont pas de petites différences.
Je pense que ce que font les agences de presse maintenant, c'est de diviser la population en groupes et d'utiliser les résultats pour estimer le vote de chaque groupe (y compris la participation). Celles-ci peuvent être basées sur des modèles et des hypothèses antérieures basées sur des élections précédentes, et pas seulement sur les données de cette élection. Ceux-ci peuvent ne pas prendre en compte les bizarreries telles que les bulletins de vote à papillon de Palm Beach.
la source
Dans l'échantillonnage d'enquête, l'erreur-type de l'estimation de la proportion est nécessaire. Cela dépend plus de i que de j. Il faut également que les bulletins de vote ouverts soient sélectionnés au hasard. Si p est la vraie proportion finale pour le candidat A, alors la variance de l'estimation est
En faisant une projection, les sondeurs peuvent sélectionner un échantillon aléatoire stratifié parmi les votes accumulés pour éviter tout biais potentiel qui pourrait se produire si l'on regarde tous les bulletins de vote comptés. Le problème avec l'examen de tous les votes accumulés est que certaines circonscriptions finissent par compter sur les autres et qu'elles peuvent ne pas être représentatives de la population.
L'article ici fournit une bonne couverture du problème et de nombreuses références.
Il a été souligné que les votes accumulés peuvent fournir des estimations biaisées des proportions, car soit les circonscriptions qui n'ont pas encore été déclarées sont des circonscriptions qui ont tendance à favoriser le parti avec le candidat en fuite, soit les bulletins de vote par correspondance sont susceptibles de favoriser le candidat en fuite. et ces votes sont comptés en dernier. Les sondeurs sophistiqués comme Harris et Gallup ne tombent pas dans de tels pièges. La simple analyse de la construction d'intervalles de confiance basée sur les votes accumulés que j'ai décrite n'est qu'un des facteurs utilisés. Ces sondeurs ont beaucoup plus d'informations à leur disposition. Ils ont des sondages qui ont été effectués peu de temps avant les élections et ils ont les schémas de vote de tous les bureaux de vote et des votes des absents lors des élections des dernières années.
Donc, s'il y a des biais clairs qui pourraient faire basculer une élection serrée dans la direction opposée, les sondeurs le reconnaîtront et retarderont la projection d'un gagnant.
Aux États-Unis, les bulletins de vote par correspondance proviennent principalement des militaires à l'étranger et des étudiants qui sont à l'école loin de chez eux. Alors que les militaires ont tendance à être plus conservateurs et à voter pour les républicains, les collègues étudiants ont tendance à être plus libéraux et à voter démocrates. Toutes ces considérations sont prises en compte.
Le soin et la sophistication des sondages modernes sont la raison pour laquelle des erreurs grossières telles que le sondage Literary Digest de 1936 ou la concession prématurée du journal de Chicago de l'élection de 1948 à Dewey ne se sont pas produites depuis lors.
la source