Brexit: le «congé» était-il statistiquement significatif? [fermé]

12

Dans cet article, nous posons une question sur un phénomène naturel appelé les humains tentent de trouver une décision en comptant les votes . L'incident spécifique d'un tel phénomène naturel sur lequel porte cette question est le cas du Brexit .

Remarque: la question ne concerne pas la politique. Le but est d'essayer de discuter de ce phénomène naturel d'un point de vue statistique basé sur des observations.

La question spécifique est:

  • Question: Que signifie le vote de Brexit pour quitter ? Par exemple, cela signifie-t-il que le public veut vraiment quitter l'UE? Cela signifie-t-il simplement que le public n'est pas sûr et a besoin de plus de temps pour réfléchir? Ou s'agit-il d'autre chose?51.9%

Hypothèse 1: il n'y a pas d'erreur dans le processus de vote.

Homme des cavernes
la source
14
La démocratie n'est pas une question de signification statistique. Le résultat de 51,9% signifie que 51,9% de ceux qui ont voté ont voté "partir". Ce n'est pas un sondage d'opinion. Ceux qui n'ont pas voté ont voté en (ne) utilisant pas leurs pieds. Interpréter 51,9% comme «le public n'est pas sûr et a besoin de plus de temps pour réfléchir», c'est tout simplement mentir avec les statistiques. Brexit s'est produit avec la probabilité 1.
Tim
7
Ce fil est destiné à être non statistique, subjectif et peut-être même polémique. Il n'est tout simplement pas adapté à ce site, quelle que soit sa popularité. Nous avons une salle de chat peuplée de personnes qui seraient heureuses de s'engager davantage dans de telles conversations: consultez-la!
whuber
2
Je crois que la discussion actuelle est statistiquement ciblée et est un bon exemple d'interprétation des résultats de vote tels qu'ils s'appliquent aux tests statistiques.
Underminer
3
Vous soulevez un problème important: l'erreur de mesure des paramètres d'opinion publique tels que les sondages. Je crains que la principale source d'erreur ne provienne pas de la taille de l'échantillon.
Aksakal
4
À mon humble avis, il s'agit d'une question non statistique avec un mince placage de statistiques ajouté pour masquer ce fait. Selon moi, l'hypothèse "il n'y a pas d'erreur dans le processus de vote" élimine toutes les considérations statistiques et oriente nécessairement la discussion sur ce que "voter ... signifie" dans une démocratie. C'est une question de science politique et de philosophie, pas de statistiques.
whuber

Réponses:

17

Je suis d'accord avec @Underminer qu'il n'y a pas d'erreur d'échantillonnage, mais pas parce que l'échantillon est grand, mais parce qu'il n'y a pas eu d'échantillonnage . Personne n'a été sélectionné pour voter. Il y avait évidemment une fraction négligeable de personnes qui voulaient voter mais qui n'étaient pas en mesure (par exemple, ont eu un accident de voiture ce jour-là), ou qui ont fait des votes invalides, mais c'est le seul "échantillonnage" ici.

Le résultat est exact, il n'y a pas d'erreur car toute la population a participé au vote (certains y ont participé en n'y participant pas). Certaines personnes ont décidé de voter, d'autres non. Certains ont décidé de voter en congé, d'autres non. La démocratie n'est pas une question de signification statistique, mais de ce qui s'est réellement passé . Le vote ne vise pas à connaître l'opinion des gens, mais à prendre une décision. En fait, les gens ne votent parfois pas selon ce qu'ils pensent, mais pour manifester ou réaliser quelque chose . Par exemple, aux élections, les gens peuvent voter non pas pour leur candidat préféré, mais pour leur deuxième candidat préféré s'ils pensent qu'il a plus de chances de gagner.

Tim
la source
Prenons le cas d'une zone grise où la population votante n'est pas très sûre de ce qui est bon pour elle. Par exemple, le cas d'avoir 2 candidats qui sont presque aussi bons. Dans un tel cas, je pense que ceux qui votent différeront probablement de manière non systématique car je pense que leurs votes pourraient avoir une distribution proche de celle uniforme. Mon objectif ici n'est pas de redéfinir la démocratie (un sujet politique) mais plutôt de voir ce que nous pouvons dire si le Brexit était une zone grise?
homme des cavernes
2
@caveman peu importe s'ils sont sûrs ou non, ce qui importe, c'est la façon dont ils ont voté, car le vote concerne les votes réels. Bien sûr, certaines personnes n'avaient pas d'opinion claire, certaines votant et d'autres non, mais cela n'a pas d'importance car ce qui compte, ce sont les votes réels de ceux qui ont voté.
Tim
Si je comprends bien, votre point concerne la façon dont la démocratie interprète les votes? Je suis d'accord avec toi. Cependant, je ne l'interprète pas comme le font les politiciens. J'essaie d'utiliser la population pour déterminer si une décision est bonne, mauvaise ou pas très claire. Il s'agit d'un usage différent du vote.
homme des cavernes
2
Les gens de @caveman changent d'avis au fil du temps, les psychologues ont écrit des milliers d'articles à ce sujet ... Oui, 51,9% ne signifie pas qu'exactement 51,9% des Britanniques sont sûrs à 100% de quitter l'UE. Les gens peuvent même être incertains quant à la comparaison des longueurs de lignes ( en.wikipedia.org/wiki/Asch_conformity_experiments ) ...
Tim
1
@Aksakal Je ne vais pas commenter qui a le droit de voter et qui ne l'est pas. Je ne vais pas non plus dire à quel point il pourrait être difficile d'obtenir les pouvoirs nécessaires. C'est de la politique et en tant que telle, pas sur le sujet ici. D'un point de vue statistique, chaque électeur éligible a une certaine probabilité de ne pas voter. Cette probabilité peut être influencée par certains facteurs qui peuvent être liés ou non à leurs préférences, mais chaque électeur éligible choisit (ou non) d'exercer ce droit à sa discrétion.
user3697176
9

51,9% est le pourcentage d'électeurs qui veulent partir . Étant donné que la taille de l'échantillon est si grande (> 33 millions), il n'y a pratiquement aucune erreur d'échantillonnage aléatoire.

Les tests de signification statistique tenteraient de déterminer si la différence entre rester et partir pourrait s'expliquer uniquement par une erreur d'échantillonnage aléatoire, et la différence serait certainement significative (voir la réponse de @ caveman).

Le problème avec cette approche est que la signification statistique fait une hypothèse très forte que l'échantillon est représentatif de l'ensemble de la population (toute la Grande-Bretagne), pas seulement ceux qui votent.

Le taux de non-réponse (ceux qui ne votent pas) est extrêmement important pour déterminer si plus de la moitié de la Grande-Bretagne souhaite «partir» et est difficile à mesurer. Un biais de non-réponse est créé lorsque les sous-groupes qui sont moins susceptibles de voter ont des opinions systématiquement différentes. Sur la base des sondages à la sortie, par exemple, les milléniaux étaient moins susceptibles de voter, mais plus susceptibles de voter pour rester , ce qui fausse les résultats lorsqu'ils tentent de représenter la population de toute la Grande-Bretagne.

Pour cette raison, les tests de signification statistique au sens traditionnel sont largement inappropriés .


Hypothèses: nous devons définir certains termes pour que tout cela ait un sens et éviter toute discussion politique sur ce que le vote tente d'accomplir. Voici mes définitions:

Population: toute personne vivant en Grande-Bretagne

Cadre d'échantillonnage: Toute personne éligible ayant le droit de vote et capable de voter

Méthode d'échantillonnage: réponse volontaire, l'acte de voter participe à l'enquête

Échantillon: les personnes qui votent réellement

Dans cette configuration, la proportion d'échantillon pourrait être utilisée (pour le meilleur ou pour le pire) pour estimer le pourcentage de toutes les personnes qui se penchent pour rester (ou partir ).

Underminer
la source
8

Tu demandes

Que signifie le vote de 51,9% sur le Brexit pour quitter?

Cela signifie que 51,9% des électeurs ont voté pour partir.

Par exemple, cela signifie-t-il que le public veut vraiment quitter l'UE? Cela signifie-t-il simplement que le public n'est pas sûr et a besoin de plus de temps pour réfléchir? Ou s'agit-il d'autre chose?

Les votes comprenaient votes "congé" et 1617421887 votes "restants", soit 1216146297 électeurs éligibles n'ont pas voté et environ 18 millions d'habitants ne sont pas éligibles. Étant donné que ni la collecte des électeurs réels ni la collecte des électeurs éligibles n'est "le public" et ni un échantillon représentatif (aléatoire, impartial, choisissez un adjectif pertinent) du "public", le vote Brexit à 51,9% n'est pas informatif pour votre deuxième et les questions suivantes.1293135318

Il aurait peut-être été possible de construire un questionnaire répondant à vos questions. Cela ne semble pas avoir été le cas lors du référendum tel qu'il a été mis en œuvre.

Eric Towers
la source
1
Pourriez-vous s'il vous plaît discuter de la signification des votes par rapport aux électeurs (c'est-à-dire pas à l'ensemble de la population), au-delà de la conclusion apparente que cela signifie " 51,9% de congés votés "? Je me demande quelle est l'étendue des informations que nous pouvons en tirer.
homme des cavernes
4
Caveman, ce commentaire, plus que tout autre, démontre que votre question n'est pas statistique. Étant donné que 51,9% (avec le nombre total) constituent toutes les données en preuve sur les électeurs et qu'il n'y a pas d'incertitude (sauf si vous voulez contester l'exactitude du dépouillement, qui est un problème distinct), votre rejet de cette réponse implique vous recherchez des conclusions non statistiques .
whuber
Et si nous modélisons le Brexit comme un problème de classification binaire et considérons les électeurs comme des estimations des classificateurs membres d'un ensemble. Dans ce modèle, le but n'est pas d'identifier ce que la majorité des citoyens veulent, mais plutôt le but est d'identifier le classificateur optimal à partir de l'espace des classificateurs. Nous pouvons ensuite utiliser certaines mesures pour tester la qualité d'un tel ensemble de classificateurs basé sur l'électeur humain. Par exemple, nous pouvons utiliser la perplexité ou quelque chose d'autre qui convient à cette tâche de classification binaire où la vérité du terrain est inconnue (par exemple, nous ne savons clairement pas si le congé vaut mieux que de rester).
homme des cavernes
@caveman: Étant donné que la vérité du terrain est (correctement) inconnue, quelle métrique utiliseriez-vous pour "identifier le classificateur optimal à partir de l'espace des classificateurs"? Une telle métrique code les biais de l'analyste qui choisit la métrique, à l'exception de la métrique "reproduit le résultat du vote", pour laquelle métrique vous connaissez déjà la réponse: 51,9% / 48,1%.
Eric Towers
@EricTowers J'ai apporté ceci à l'adresse policy.stackexchange.com où j'ai parlé de différentes méthodes - policy.stackexchange.com/questions/11433/…
caveman
2

TL; DR

R=100051.9%51.9%

0

48.1%

0

Je conclus donc que le vote sur le Brexit n'est pas un effet secondaire bruyant d'une population incertaine ou confuse . Il semble y avoir une raison systématique qui les pousse à quitter l'UE.

J'ai téléchargé le code du simulateur ici: https://github.com/Al-Caveman/Brexit

Détails

Étant donné l' hypothèse 1 , les réponses (ou hypothèses) possibles sont:

  • H0
  • H1

Remarque: il est impossible que le public veuille rester en toute confiance car nous avons exclu les erreurs de vote.

H0H1

  • 51.9%
  • 151.9%

H1H0

Afin de mesurer cette probabilité, nous devons connaître la distribution d'une population britannique incertaine dans un système de vote binaire tel que le Brexit. Par conséquent, ma première étape consiste à simuler cette distribution en suivant l'hypothèse ci-dessous:

  • Hypothèse 2: une population composée d' individus incertains aura un vote au hasard . C'est-à-dire que chaque réponse possible a une chance égale d'être choisie.

À mon avis, cette hypothèse est juste / raisonnable.

De plus, nous modélisons les campagnes de congés et restes comme deux processus distincts comme suit:

  • PleaveOleave=[l1,l2,,ln]
  • PremainOremain=[r1,r2,,rn]

où:

  • n
  • i{1,2,,n}li,ri{0,1}01

soumis à la contrainte suivante:

  • i{1,2,,n}liri1li=1ri=0ri=1li=0i{1,2,,n}

Oleave=[1,0,0]3

Oremain=[0,1,0]3

Oleave[3]=Oremain[3]=0

33,568,18451.9%10051.9=48.1%

  • n=33,568,184
  • 33,568,184×0.519=17,421,887.496
    i=133,568,184Oleave[i]=17,421,887.49617,421,887
  • 33,568,184×(10.519)=16,146,296.504
    i=133,568,184Oremain[i]=16,146,296.50416,146,297

Par conséquent, nous définissons les tableaux de sortie comme suit:

  • i{1,2,,17421887}Oleave[i]=1
  • i{17421887+1,17421887+2,,33568184}Oleave[i]=0
  • i{1,2,,17421887}Oremain[i]=0
  • i{17421887+1,17421887+2,,33568184}Oremain[i]=1
  • i{1,2,,33568184}Ounsure,m[i]=CC{0,1}mOunsure,mOunsure,mOunsure,1=Ounsure,20.533,568,184

pleave

pleave=1Rm=1R{1if (i=133,568,184Oleave[i])(i=133,568,184Ounsure,m[i])0else
ROunsure,m est défini.

premain

premain=1Rm=1R{1if (i=133,568,184Oremain[i])(i=133,568,184Ounsure,m[i])0else

R=1,000

total leave votes: 17421887
total remain votes: 16146297
simulating p values............ ok
p value for leave: 0.000000
p value for remain: 0.000000

En d'autres termes:

  • pleave=0
  • premain=0
Homme des cavernes
la source
2
Peut-être plus important dans ce cas est le taux de non-réponse (c'est-à-dire les personnes qui ne votent pas). La marge d'erreur (ou mesure de la signification statistique) ne prend en compte que l'erreur d'échantillonnage aléatoire. Le biais de non-réponse N'EST PAS inclus dans cela, et il est beaucoup plus percutant qu'une erreur d'échantillonnage aléatoire avec un sondage avec une taille d'échantillon aussi grande.
Underminer
46,499,53746,499,537(17421887+16146297)=12,931,353
3
Il n'existe aucun moyen statistiquement satisfaisant de traiter les données manquantes non aléatoires.
Underminer
Ceux qui n'ont pas voté pourraient être composés de personnes qui ne se soucient pas de la politique (par exemple, plus de confiance). Alternativement, ces non-votants pourraient être ceux qui n'étaient pas sûrs. Ou, ce pourrait être un mélange des deux. Que se passerait-il si nous supposions que « tous les électeurs ne sont pas sûrs »? Serait-ce une limite supérieure pour tester si la situation actuelle est celle où le public a le sentiment que le Brexit est une zone grise ?
homme des cavernes
3
Il y a ici une confusion sur la nature et la portée des statistiques. Vous essayez de créer un modèle de processus de vote, et comment cela peut informer les mécanismes et la validité de la gouvernance et de la prise de décision publique. C'est une tâche valable en science politique . Ce ne sont tout simplement pas des statistiques (bien qu'il s'agisse de statistiques).
gung - Rétablir Monica
1

Vous pourriez poser une question légèrement différente: en supposant que 50% d'une très grande population ont voté «oui» et que vous avez demandé un échantillon aléatoire de taille S, quelle est la probabilité que 51,9% de votre échantillon ait répondu «oui», selon le taille de l'échantillon?

S1/2

S1/2(6.10.5/0.019)2

gnasher729
la source
0

Il s'agit d'une autre solution utilisant une méthode analytique au lieu d'une simulation.

n0.5

51.9%17,421,887Oleave0.533,568,18417,421,887+10.533,568,184

17,421,887

i=17,421,88733,568,1840.533,568,184=(33,568,18417,421,887)×0.533,568,184=8.39663381928984×10101050240

( calculé par Wolframalpha )8.39663381928984×1010105024

Et c'est la probabilité d'avoir d'un congé de vote de population incertain .51.9%

Homme des cavernes
la source