Brexit: il "congedo" è stato statisticamente significativo? [chiuso]


12

In questo post facciamo una domanda su un fenomeno naturale chiamato uomo che tenta di trovare una decisione contando i voti . L'incidente specifico di tale fenomeno naturale su cui si pone questa domanda è il caso della Brexit .

Nota: la domanda non riguarda la politica. L'obiettivo è quello di provare a discutere di tale fenomeno naturale da un punto di vista statistico basato su osservazioni.

La domanda specifica è:

  • Domanda: cosa significa il Brexit che vota per partire ? Ad esempio, significa che il pubblico vuole davvero lasciare l'UE? Significa semplicemente che il pubblico non è sicuro e ha bisogno di più tempo per pensare? O è qualcos'altro?51,9%

Presupposto 1: non vi sono errori nel processo di voto.


14
La democrazia non riguarda il significato statistico. Il risultato del 51,9% significa che il 51,9% di coloro che hanno votato, ha votato "lasciare". Questo non è un sondaggio d'opinione. Coloro che non hanno votato, hanno votato (non) usando i loro piedi. L'interpretazione del 51,9% in quanto "il pubblico non è sicuro e ha bisogno di più tempo per pensare" sta semplicemente mentendo con le statistiche. La Brexit è avvenuta con probabilità 1.
Tim

7
Questo thread è destinato a essere non statistico, supponente e forse persino polemico. Non è adatto per questo sito, indipendentemente da quanto popolare possa essere. Abbiamo una chat room popolata da persone che sarebbero felici di impegnarsi ulteriormente in tali conversazioni: dai un'occhiata!
whuber

2
Credo che l'attuale discussione sia focalizzata statisticamente ed è un buon esempio di interpretazione dei risultati di voto in quanto si applica ai test statistici.
Underminer,

3
Si pone un problema importante: errore di misurazione delle metriche dell'opinione pubblica come i sondaggi. Temo che la principale fonte di errore non provenga dalle dimensioni del campione.
Aksakal,

4
IMHO, questa è una domanda non statistica con un sottile rivestimento di statistiche aggiunto per mascherare questo fatto. Mentre lo leggo, l'assunto "non vi è alcun errore nel processo di voto" elimina tutte le considerazioni statistiche e indirizza necessariamente la discussione su cosa significhi "votare ..." in una democrazia. È una questione di scienza politica e filosofia, non di statistica.
whuber

Risposte:


17

Concordo con @Underminer che non vi sono errori di campionamento, ma non perché il campione è grande, ma perché non è stato coinvolto alcun campionamento . Nessuno è stato campionato per votare. Ovviamente c'era una parte trascurabile di persone che volevano votare ma, non erano in grado di farlo (ad es. Ha avuto un incidente d'auto in questo giorno), o che hanno fatto voti non validi, ma questo è l'unico "campionamento" qui.

Il risultato è esatto, non vi sono errori in quanto l'intera popolazione ha preso parte al voto (alcuni hanno partecipato non partecipando). Alcune persone hanno deciso di votare, altre no. Alcuni hanno deciso di votare in congedo, altri no. La democrazia non riguarda il significato statistico, ma ciò che è realmente accaduto . Votare non ha lo scopo di conoscere l'opinione della gente, ma di prendere una decisione. In realtà, a volte le persone non votano in base a ciò che pensano, ma per manifestare o ottenere qualcosa . Ad esempio, nelle elezioni le persone possono votare non per il loro candidato preferito, ma per il loro secondo preferito se pensano che abbia maggiori possibilità di vincere.


Considera il caso di un'area grigia in cui la popolazione votante non è molto sicura di ciò che è buono per loro. Ad esempio, il caso di avere 2 candidati che sono quasi ugualmente buoni. In tal caso, penso che quelli che votano, probabilmente differiranno in modo non sistematico poiché ritengo che i loro voti possano avere una distribuzione vicina a quella uniforme. Il mio obiettivo qui non è ridefinire la democrazia (un argomento politico) ma piuttosto vedere cosa possiamo dire se la Brexit fosse una zona grigia?
cavernicolo,

2
@caveman non importa se sono sicuri o no, ciò che conta è il modo in cui hanno votato poiché il voto riguarda i voti effettivi. Certo, alcune persone non avevano un'opinione chiara, alcune votavano e altre no, ma anche questo non importa poiché ciò che conta sono i voti effettivi di coloro che hanno votato.
Tim

Se lo capisco correttamente, il tuo punto è su come la democrazia interpreta i voti? Sono d'accordo con te. Tuttavia, non lo sto interpretando come fanno i politici. Sto cercando di usare la popolazione per identificare se una decisione è buona, cattiva o non molto chiara. Questo è un diverso uso del voto.
cavernicolo,

2
Le persone di @caveman cambiano idea in ogni momento, gli psicologi hanno scritto migliaia di articoli su questo ... Sì, il 51,9% non significa che esattamente il 51,9% degli inglesi sia sicuro al 100% di lasciare l'UE. Le persone non possono nemmeno essere sicure di confrontare lunghezze di linee ( en.wikipedia.org/wiki/Asch_conformity_experiments ) ...
Tim

1
@Aksakal Non ho intenzione di commentare chi può votare e chi no. Inoltre, non commenterò quanto sia difficile ottenere le credenziali necessarie. Questa è politica e come tale non in tema qui. Da un punto di vista statistico, ogni elettore idoneo ha una certa probabilità di non votare. Questa probabilità potrebbe essere influenzata da determinati fattori che possono o meno essere correlati alle loro preferenze, ma ciascun elettore idoneo sceglie (non) di esercitare tale diritto a sua discrezione.
user3697176,

9

Il 51,9% è la percentuale di elettori che vogliono andarsene . Poiché la dimensione del campione è così grande (> 33 milioni), non vi è praticamente alcun errore di campionamento casuale.

I test di significatività statistica proverebbero a determinare se la differenza tra permanenza e congedo potrebbe essere spiegata dal solo errore di campionamento casuale e la differenza sarebbe certamente significativa (vedi la risposta di @ caveman).

Il problema con questo approccio è che la significatività statistica dà una forte supposizione che il campione sia rappresentativo dell'intera popolazione (tutta la Gran Bretagna), non solo di coloro che votano.

Il tasso di mancata risposta (quelli che non votano) è estremamente importante per determinare se più della metà di tutta la Gran Bretagna vuole "andarsene" ed è difficile da misurare. La distorsione da non risposta viene creata quando i sottogruppi che hanno meno probabilità di votare hanno visioni sistematicamente diverse. Sulla base dei sondaggi di uscita, ad esempio, i millennial avevano meno probabilità di votare, ma avevano maggiori probabilità di votare per rimanere , il che pregiudica i risultati quando si cerca di rappresentare la popolazione di tutta la Gran Bretagna.

Per questo motivo, i test di significatività statistica nel suo senso tradizionale sono in gran parte inappropriati .


Presupposti: dobbiamo definire alcuni termini affinché tutto ciò abbia un senso ed eviti la discussione politica su ciò che il voto sta cercando di realizzare. Ecco le mie definizioni:

Popolazione: ogni persona che vive in Gran Bretagna

Frame di campionamento: ogni persona eleggibile votante in grado di votare

Metodologia di campionamento: risposta volontaria, l'atto di voto partecipa al sondaggio

Esempio: le persone che effettivamente votano

In questa configurazione, la proporzione del campione potrebbe essere utilizzata (nel bene o nel male) per stimare la percentuale di tutte le persone che tendono a rimanere (o ad andarsene ).


8

Tu chiedi

Cosa significa il 51,9% di Brexit che vota per partire?

Significa che il 51,9% degli elettori ha votato per partire.

Ad esempio, significa che il pubblico vuole davvero lasciare l'UE? Significa semplicemente che il pubblico non è sicuro e ha bisogno di più tempo per pensare? O è qualcos'altro?

I voti comprendevano voti "lascia" e 1617421887 voti "rimangono", indicando 1216146297 elettori ammissibili non hanno votato e circa 18 milioni di abitanti non sono elettori ammissibili. Poiché né la raccolta di elettori effettivi né la raccolta di elettori ammissibili è "il pubblico" e né è un campione rappresentativo (casuale, imparziale, scegli un aggettivo pertinente) di "pubblico", il voto Brexit del 51,9% non è conforme al tuo secondo e domande successive.1293135318

Potrebbe essere stato possibile costruire un questionario rispondente alle tue domande. Questo non sembra essere stato quello che è successo nel referendum come attuato.


1
Potresti discutere il significato dei voti in relazione agli elettori (cioè non l'intera popolazione), al di là della conclusione superficiale che significa " congedo votato al 51,9% "? Mi chiedo quale sia l'estensione delle informazioni che possiamo estrarre da questo.
cavernicolo

4
Caveman, questo commento, più di ogni altro, dimostra che la tua domanda non è statistica. Poiché il 51,9% (insieme ai conteggi totali) costituisce tutti i dati in evidenza sugli elettori e non vi è incertezza (a meno che non si desideri contestare l'accuratezza del conteggio, che è una questione separata), il rifiuto di questa risposta implica stai cercando conclusioni non statistiche .
whuber

E se modellassimo la Brexit come un problema di classificazione binaria e considerassimo gli elettori come stime di classificatori che sono membri di un insieme. In questo modello, l'obiettivo non è quello di identificare ciò che vuole la maggior parte dei cittadini, ma piuttosto quello di identificare il classificatore ottimale dallo spazio dei classificatori. Possiamo quindi utilizzare alcune misure per testare la bontà di un tale insieme di classificatori basato sugli elettori umani. Ad esempio, possiamo usare la perplessità o qualcos'altro adatto a questo compito di classificazione binaria in cui la verità di base è sconosciuta (ad esempio, chiaramente non sappiamo se lasciare è meglio di rimanere).
cavernicolo

@caveman: Dato che la verità fondamentale è (correttamente) sconosciuta, quale metrica useresti per "identificare il classificatore ottimale dallo spazio dei classificatori"? Qualsiasi metrica di questo tipo codifica i pregiudizi dell'analista che sceglie la metrica, ad eccezione della metrica "riproduce il risultato del voto", per la quale si conosce già la risposta: 51,9% / 48,1%.
Eric Towers,

@EricTowers Ho preso questo per politics.stackexchange.com in cui ho parlato di diversi metodi - politics.stackexchange.com/questions/11433/...
Caveman

2

TL; DR

Ho simulato una popolazione insicura al di sotto (sotto i dettagli ) per volte, e quindi ho misurato la probabilità di osservare un voto in congedo 51,9 % in tale popolazione simulata incerta . Questo mi ha dato la probabilità simulata che una popolazione insicura possa raggiungere un voto di congedo pari o superiore al 51,9 % .R=100051.9%51.9%

Questa probabilità simulata di congedo sotto la popolazione incerta è .0

Forse ridondante, ma ho anche fatto lo stesso ma con rimangono per misurare la probabilità che tali dubbi della popolazione per ottenere un voti rimangono .48.1%

Questa probabilità simulata di rimanere sotto la popolazione incerta è anche .0

Pertanto, concludo che il voto sulla Brexit non è un effetto collaterale rumoroso di una popolazione incerta o confusa . Sembra esserci una ragione sistematica che li sta spingendo a lasciare l'UE.

Ho caricato il codice del simulatore qui: https://github.com/Al-Caveman/Brexit

Dettagli

Dato l' Assunzione 1 , le possibili risposte (o ipotesi) sono:

  • :H0il pubblicononèsicuro.
  • :H1il pubblicovuoleandarsene confiducia.

Nota: è impossibile che il pubblico voglia rimanere fiducioso perché abbiamo escluso errori di voto.

Per rispondere a questa domanda (ovvero se H0 o H1 ), provo a misurare:

  • La probabilità che un incerto popolazione può raggiungere congedo voto.51,9%
  • Oppure, la probabilità che una popolazione incerta possa raggiungere rimane votata.1-51,9%

Se questa probabilità è abbastanza bassa, possiamo concludere che il pubblico vuole con fiducia partire (es. ). Tuttavia, se questa probabilità è abbastanza grande, possiamo concludere che il pubblico non è sicuro di decidere Brexit (cioè H 0 ).H1H0

Per misurare questa probabilità, dobbiamo conoscere la distribuzione di una popolazione britannica incerta in un sistema di voto binario come Brexit. Pertanto, il mio primo passo è quello di simulare questa distribuzione seguendo il presupposto seguente:

  • Assunzione 2: una popolazione composta da individui incerti avrà un voto casuale casuale . Cioè ogni possibile risposta ha le stesse possibilità di essere scelta.

A mio avviso, questo presupposto è giusto / ragionevole.

Inoltre, modelliamo il congedo e restiamo campagne come due processi distinti come segue:

  • Processo con l'uscita O ferie = [ l 1 , l 2 , ... , l n ] .PpartireOpartire=[l1,l2,...,ln]
  • Il processo con l'uscita O rimane = [ r 1 , r 2 , , r n ] .PrimanereOrimanere=[r1,r2,...,rn]

dove:

  • è la popolazione totale del Regno Unito (include i non votanti).n
  • io{1,2,...,n}lio,rio{0,1}01

soggetto al seguente vincolo:

  • io{1,2,...,n}liorio1lio=1rio=0rio=1lio=0io{1,2,...,n}

Opartire=[1,0,0]3

Orimanere=[0,1,0]3

Opartire[3]=Orimanere[3]=0

33,568,18451,9%100-51,9=48.1%

  • n=33,568,184
  • 33,568,184×0,519=17,421,887,496
    Σio=133,568,184Opartire[io]=17,421,887,49617,421,887
  • 33,568,184×(1-0,519)=16,146,296,504
    Σio=133,568,184Orimanere[io]=16,146,296,50416,146,297

Pertanto, definiamo le matrici di output come segue:

  • io{1,2,...,17421887}Opartire[io]=1
  • io{17421887+1,17421887+2,...,33568184}Opartire[io]=0
  • io{1,2,...,17421887}Orimanere[io]=0
  • io{17421887+1,17421887+2,...,33568184}Orimanere[io]=1
  • io{1,2,...,33568184}Oincerto,m[io]=CC{0,1}mOincerto,mOincerto,mOincerto,1=Oincerto,20.533,568,184

ppartire

ppartire=1RΣm=1R{1Se (Σio=133,568,184Opartire[io])(Σio=133,568,184Oincerto,m[io])0altro
ROincerto,m è definito.

primanere

primanere=1RΣm=1R{1Se (Σio=133,568,184Orimanere[io])(Σio=133,568,184Oincerto,m[io])0altro

R=1,000

total leave votes: 17421887
total remain votes: 16146297
simulating p values............ ok
p value for leave: 0.000000
p value for remain: 0.000000

In altre parole:

  • ppartire=0
  • primanere=0

2
Forse più importante in questo caso è il tasso di mancata risposta (ovvero le persone che non votano). Il margine di errore (o misura della significatività statistica) tiene conto solo dell'errore casuale del campione. La distorsione da non risposta NON è inclusa in questo, ed è molto più efficace dell'errore di campionamento casuale con un sondaggio con una dimensione del campione così grande.
Underminer,

46,499,53746,499,537-(17421887+16146297)=12,931,353

3
Non esiste un modo statisticamente soddisfacente per gestire i dati mancanti non casuali.
Underminer,

Coloro che non hanno votato, potrebbero essere composti da individui a cui non interessa la politica (ad es. Non c'è più fiducia). In alternativa, tali non votanti potrebbero essere quelli che non erano sicuri. Oppure, potrebbe essere una miscela dei due. Cosa accadrebbe se assumessimo che " tutti i non votanti non sono sicuri "? Questo sarebbe un limite superiore per verificare se la situazione attuale fosse quella in cui il pubblico sentiva che la Brexit era una zona grigia ?
cavernicolo,

3
C'è una confusione qui sulla natura e la portata delle statistiche. Stai tentando di creare un modello di processo di voto e come questo possa informare i meccanismi e la validità della governance e del processo decisionale pubblico. Questo è un compito utile in Scienze politiche . Non si tratta semplicemente di statistiche (sebbene siano coinvolte le statistiche).
gung - Ripristina Monica

1

Potresti porre una domanda leggermente diversa: Supponendo che il 50% di una popolazione molto numerosa abbia votato "Sì" e hai chiesto un campione casuale di taglia S, qual è la probabilità che il 51,9% del tuo campione abbia risposto "Sì", a seconda del misura di prova?

S1/2

S1/2(6.1*0.5/0,019)2


0

Questa è un'altra soluzione che utilizza un metodo analitico anziché una simulazione.

n0.5

51,9%17,421,887Opartire0.533,568,18417,421,887+10.533,568,184

17,421,887

i=17,421,88733,568,1840.533,568,184=(33,568,18417,421,887)×0.533,568,184=8.39663381928984×10101050240

8,39663381928984×10-10105024

51,9%

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.