Perché (/) il campionamento statistico dovrebbe funzionare in politica (ad es. Gallup)?


14

I sondaggi là fuori (diciamo, Gallup) campionano un numero assurdamente basso di persone rispetto alle dimensioni della popolazione (ad esempio forse un migliaio di persone su centinaia di milioni).

Ora, per me, campionare una popolazione come mezzo per stimare le statistiche della popolazione ha senso quando hai una forte ragione di credere che i campioni siano rappresentativi della popolazione (o, allo stesso modo, di altri campioni ) .

Ad esempio, il campionamento ha ovviamente senso per gli studi medici, perché sappiamo a priori che tutti gli esseri umani hanno genomi abbastanza simili e che questo fattore fa sì che i loro corpi si comportino in modo simile.
Nota che questo non è un tipo di accoppiamento libero: il genoma è un fattore determinante abbastanza dannatamente forte .

Tuttavia, non capisco cosa giustifichi l'uso di campioni di dimensioni ridotte per cose come sondaggi politici.

Potrei comprare che forse l'80-90% delle persone in un dato quartiere vota allo stesso modo per il presidente (a causa di simili contesti socioeconomici / educativi), ma questo non sembra giustificare l'assurdamente basso numero di campioni. Non c'è letteralmente alcun motivo convincente (almeno per me) per cui 1000 elettori casuali dovrebbero comportarsi come gli altri 200 milioni di elettori.

Per me, avresti almeno bisogno (diciamo) 100 × di tale importo. Perché? Posso pensare a una serie di ragioni, ad esempio:

  1. Ci sono ~ 22.000 recinti proprio in California . Le persone crescono in modo così diverso nei loro contesti economici ed educativi che un sondaggio di dimensioni 1000 sembra ridicolmente piccolo. Come puoi riassumere interi recinti con <1 persona in media?

  2. Le persone in genere non possono cambiare le risposte dei loro corpi alla medicina, ma possono cambiare le loro opinioni sulla politica semplicemente pensandoci. Per come la vedo io, non c'è alcun fattore di forzatura simile al DNA in medicina quando si ha a che fare con la politica. Nel migliore dei casi immagino che ci dovrebbero essere piccole sacche di correlazione.

Eppure in qualche modo, sondaggi come questo sembrano ... funzionare comunque? O almeno le persone sembrano pensare di si?
Ma perché dovrebbero? Forse fondamentalmente non capisco il campionamento ? Qualcuno può spiegare?
Non riesco proprio a prendere sul serio nessuno dei sondaggi che vedo, ma mi sento come se fossi più o meno solo in questo ...


4
"Il campionamento ovviamente ha senso per gli studi medici, perché sappiamo a priori che tutti gli esseri umani hanno genomi abbastanza simili" Non ho un background medico, ma il nostro DNA differisce in realtà dalle nostre opinioni politiche? Se è così, perché è così difficile studiare la genetica e perché non ne avevamo già piena comprensione? Scommetto che se prendi due persone a caso, sarà più probabile che abbiano le stesse opinioni politiche, quindi lo stesso DNA.
Tim

3
@Tim: "Scommetto che se prendi due persone a caso, sarà più probabile che abbiano le stesse opinioni politiche, quindi lo stesso DNA". Quanto vuoi scommettere? google.com/search?q=dna+similarity+between+humans
user541686

2
Ma non è la differenza dello 0,5% la cosa più importante quando si fanno questi confronti? Inoltre, condividiamo il 60% dei geni con le mosche , quindi immagino che potremmo campionare gli umani e le mosche in modo intercambiabile per la ricerca medica? Rispetto: nel 2008 Obama ha ottenuto il 53% dei voti alle elezioni presidenziali statunitensi. Inoltre, direi che quando fai ricerche su farmaci salvavita ma potenzialmente pericolosi, dovresti prestare maggiore attenzione al campionamento rispetto a quando fai ricerche sulle preferenze per l'uso del sapone prodotto dalla società A vs B, o per i pool di opinioni.
Tim

2
@ user2338816: "È convincente perché storicamente accurato" è meno simile alla matematica e più simile alla scienza. Sono completamente disposto ad acquistarlo per motivi scientifici (perché è così che la scienza rotola), ma non per motivi puramente matematici (basati sulle prove).
user541686

1
Sfiderei l'affermazione (cauta) che i sondaggi funzionano per le elezioni. Non ricordo nemmeno che i sondaggi fossero vicini ai risultati effettivi delle elezioni da cui provengo. Ci sono semplicemente troppi fattori di cui non puoi davvero tenere conto - ad esempio, con la nostra partecipazione del 60% circa, hai quasi la probabilità di assaggiare qualcuno che non voterà rispetto a uno che non lo è. Partecipare a un sondaggio è meno sforzo del voto, e talvolta vieni persino pagato per questo. Alcuni partiti hanno una partecipazione molto più alta di altri (come il partito comunista). È necessario citare la deviazione e i "risultati" in qualsiasi campionamento.
Luaan,

Risposte:


13

Sembra che tu stia immaginando un modello di campionamento molto semplice.

Il modello più semplice per il campionamento si chiama appropriatamente campionamento casuale semplice . Seleziona un sottoinsieme della popolazione (ad es. Componendo i numeri di telefono in modo casuale) e chiedi a chiunque risponda a come stanno votando. Se 487 dicono Clinton, 463 dicono Trump, e il resto ti dà una risposta stravagante, la ditta elettorale segnalerebbe che il 49% degli elettori preferisce Clinton, mentre il 46% preferisce Trump. Tuttavia, le società elettorali fanno molto di più. Un semplice campione casuale dà uguale peso a ogni punto dati. Tuttavia, supponiamo che il campione contenga - per caso - 600 uomini e 400 donne, che chiaramente non sono rappresentativi della popolazione nel suo insieme. Se gli uomini come gruppo si inclinano in un modo, mentre le donne si appoggiano in un altro, questo influenzerà il tuo risultato. Tuttavia, poiché disponiamo di statistiche demografiche piuttosto buone, puoi ponderare *le risposte contando un po 'di più le risposte delle donne e un po' meno quelle degli uomini, in modo che la risposta ponderata rappresenti meglio la popolazione. Le organizzazioni di polling hanno modelli di pesatura più complicati che possono rendere un campione non rappresentativo simile a uno più rappresentativo.

L'idea di ponderare le risposte campionate è su un terreno statistico piuttosto solido, ma esiste una certa flessibilità nella scelta dei fattori che contribuiscono ai pesi. La maggior parte dei sondaggisti ripensa in base a fattori demografici come sesso, età e razza. Detto questo, potresti pensare che dovrebbe essere inclusa anche l'identificazione del partito (democratico, repubblicano, ecc.), Ma si scopre che la maggior parte delle aziende elettorali non lo usano nei loro pesi: l' identificazione del partito (auto) è aggrovigliata con la scelta dell'elettore in un modo che lo rende meno utile.

Molti sondaggi indicano anche i loro risultati tra i "probabili elettori". In questi, gli intervistati vengono selezionati o ponderati in base alla probabilità che si presentino effettivamente ai sondaggi. Anche questo modello è senza dubbio basato sui dati, ma la scelta precisa dei fattori consente una certa flessibilità. Ad esempio, includere le interazioni tra il candidato e la razza (o il genere) degli elettori non era nemmeno ragionevole fino al 2008 o al 2016, ma sospetto che abbiano un potere predittivo ora.

In teoria, potresti includere ogni genere di cose come fattori di ponderazione: preferenze musicali, colore degli occhi, ecc. Tuttavia, i fattori demografici sono scelte popolari per i fattori di ponderazione perché:

  • Empiricamente, si correlano bene con il comportamento degli elettori. Ovviamente, non esiste una legge vestita di ferro che "costringa" i bianchi a essere magri repubblicani, ma negli ultimi cinquant'anni hanno avuto la tendenza.
    • I valori della popolazione sono ben noti (ad es. Dal censimento o Vital Records)

Tuttavia, i sondaggisti vedono anche le stesse notizie di tutti gli altri e, se necessario, possono regolare le variabili di ponderazione.

Ci sono anche alcuni "fattori di fondente" che a volte vengono invocati per spiegare i risultati del sondaggio. Ad esempio, gli intervistati a volte sono riluttanti a dare risposte "socialmente indesiderabili". L' effetto Bradley postula che a volte gli elettori bianchi minimizzano il loro sostegno ai candidati bianchi che si scontrano con una minoranza per evitare di apparire razzisti. Prende il nome da Tom Bradley, un candidato governativo afroamericano che ha perso per poco le elezioni nonostante abbia guidato comodamente nei sondaggi.

Infine, hai perfettamente ragione che l'atto stesso di chiedere l'opinione di qualcuno può cambiarlo. Le imprese elettorali cercano di scrivere le loro domande in modo neutrale. Per evitare problemi con l'ordine delle possibili risposte, i nomi dei candidati potrebbero essere elencati in ordine casuale. Le versioni multiple di una domanda sono talvolta testate l'una contro l'altra. Questo effetto può anche essere sfruttato per fini nefasti in un sondaggio push , in cui l'intervistatore non è effettivamente interessato a raccogliere risposte ma a influenzarle. Ad esempio, un sondaggio push potrebbe chiedere "Vorresti votare per [Candidato A] anche se fosse stato riferito che era un molestatore di minori?".


* Potresti anche fissare obiettivi espliciti per il tuo campione, come ad esempio 500 uomini e 500 donne. Questo si chiama campionamento stratificato: la popolazione viene stratificata in diversi gruppi e ciascun gruppo viene quindi campionato a caso. In pratica, questo non viene fatto molto spesso per i sondaggi, perché avresti bisogno di stratificarti in molti gruppi esaustivi (ad esempio, uomini con un'istruzione universitaria tra 18-24 anni a Urban Texas).


2
Capisco sicuramente che non stanno eseguendo un semplice campionamento casuale, ma la mia domanda è se ciò che stanno facendo sia giusto solo perché capita che i loro presupposti siano corretti (cioè un sospetto ragionevole ma soggettivo), o se i presupposti sono anche statisticamente giustificabile. Vedi il mio commento sull'altra risposta qui .
user541686

3
Entrambi, penso. La ponderazione del campione è la cosa statisticamente corretta da fare, ma c'è una certa flessibilità nel decidere come scegliere quali fattori vanno applicati ai pesi. Ad esempio, razza, genere ed educazione sono tutti utili, ma risulta che l'identificazione del partito spesso non lo è (ad esempio, theguardian.com/commentisfree/2012/sep/27/… ), probabilmente perché è legata al candidato dell'elettore scelta.
Matt Krause

1
Allo stesso modo, i pesi a volte includono una stima della probabilità che il rispondente abbia di votare: i giovani fanno molto rumore, ma non sempre si presentano; gli anziani raramente partecipano ai raduni, ma si presentano in modo affidabile alle urne. Questo potrebbe essere stimato sulla base di dati storici (i voti degli elettori sono a volte pubblici), ma potrei immaginare alcuni luoghi adattati per gli afro-americani nel 2008 e per le donne nel 2016.
Matt Krause,

Grazie! Potrebbe essere utile menzionare anche questa "flessibilità" nella tua risposta :) +1
user541686

10

C'è un teorema matematico chiamato "legge dei grandi numeri". Immagina di voler determinare la probabilità che una moneta arrivi a testa alta. La "popolazione" di lanci di monete è l'infinito, molto più grande delle oltre 300.000.000 di persone negli Stati Uniti. Ma secondo la legge dei grandi numeri, più lanci di monete fai, più accurata sarà la tua stima.

Il sondaggio ideale: nel sondaggio ideale, i sondaggisti sceglierebbero casualmente nomi dal censimento degli Stati Uniti, scopriranno dove vivono quelle persone, poi andrebbero a bussare alla loro porta. Se la persona dice che stanno pianificando di votare, il sondaggista chiede per chi stanno votando e registra la loro risposta. Il polling come questo è matematicamente garantito per funzionare e la quantità di errore nella misurazione per ogni dato livello di confidenza può essere calcolata facilmente .

Ecco cosa significa l'errore: Supponiamo che in base al tuo sondaggio, hai una probabilità del 52% che Candidate Awesome McPerfect vincerà, con un errore del 3% con una sicurezza del 98%. Ciò significa che puoi essere sicuro del 98% che la parte reale degli elettori che preferiscono il candidato Awesome McPerfect è compresa tra il 49% e il 55%.

Una nota su errore e fiducia Per una data dimensione del campione, più sei sicuro di te, più grande sarà il tuo errore. Pensaci: sei sicuro al 100% che la vera proporzione che supporta canditate Awesome è tra lo 0% e il 100% (la maggior parte degli errori possibili) e sei sicuro allo 0% che la vera proporzione che supporta canditate Awesome è esattamente 52.0932840985028390984308% (errore zero). Più sicurezza significa più errore, meno fiducia significa meno errore. Tuttavia, il rapporto tra confidenza ed errore NON è lineare! (Vedi: https://en.wikipedia.org/wiki/Confidence_interval )

Sondaggi nel mondo reale: perché è costoso in elicottero sondaggisti in tutte le parti del paese bussare alle porte di persone a caso (anche se mi piacerebbe vederlo accadere; se sei un miliardario e vedi questo, per favore considerare di finanziare questo), i sondaggi nel mondo reale sono più complessi. Vediamo una delle strategie più comuni: chiamare elettori casuali e chiedere loro per chi voterebbero. È una buona strategia, ma ha alcuni fallimenti ben noti:

  1. Le persone spesso scelgono di non rispondere al telefono e di rispondere ai sondaggisti (es. Me)
  2. Alcuni dati demografici hanno maggiori probabilità di avere un telefono fisso (ad es. Elettori più anziani)
  3. Alcuni dati demografici hanno maggiori probabilità di rispondere ai sondaggisti (ad es. Elettori più anziani)

Poiché diversi dati demografici votano in modi diversi, i sondaggisti devono fare del loro meglio per controllare le differenze nei loro dati grezzi (in base a chi ha deciso di rispondere al telefono) e i risultati delle elezioni effettive. Ad esempio, se il 10% delle persone che hanno preso il telefono erano ispanici, ma il 30% degli elettori nelle ultime elezioni era ispanico, allora darebbero il triplo del peso agli elettori ispanici nel loro sondaggio. Se il 50% delle persone che hanno risposto al telefono aveva più di 60 anni, ma solo il 30% delle persone che hanno votato nelle ultime elezioni aveva più di 60 anni, darebbe meno peso agli elettori più anziani che hanno risposto. Non è perfetto, ma può portare ad alcune impressionanti imprese di predizione (Nate Silver ha previsto correttamente i risultati in ciascuno dei 50 stati delle elezioni del 2012 usando statistiche,

Un avvertimento per i saggi: i sondaggisti fanno le migliori previsioni che possono basarsi su come le cose hanno funzionato in passato. In generale , le cose si comportano allo stesso modo ora come in passato, o almeno il cambiamento è abbastanza lento che il passato recente (su cui si concentrano maggiormente) assomiglierà al presente. Tuttavia, a volte ci sono rapidi cambiamenti nell'elettorato e le cose vanno male. Forse gli elettori di Trump hanno un po 'meno probabilità del tuo elettore medio di rispondere al telefono e la ponderazione per demografia non tiene conto di ciò. O forse i giovani (che sostengono in modo schiacciante Hillary) lo sono ancora di piùè improbabile che risponda al telefono rispetto ai modelli previsti, e quelli che rispondono al telefono hanno più probabilità di essere repubblicani. O forse è vero il contrario di entrambi - non lo sappiamo. cose del genere sono variabili nascoste che non compaiono nei dati demografici comunemente raccolti.

Noi vorremmo sapere se abbiamo mandato sondaggisti per bussare alle porte casuali (ahem, billionare immaginaria lettura di questo), da allora non avremmo a cose peso in base ai dati demografici, ma fino ad allora, le dita incrociate.


3
Apprezzo la risposta, ma è un po 'rispetto elementari alla domanda che stavo cercando di chiedere e il mio background (non so se avete notato, ma io sono non esattamente nuovo ai principi fondamentali della probabilità / statistiche); Non credo che la risposta alla mia domanda qui sia fondamentale come la tua. Per esempio: un presupposto per la classica legge dei grandi numeri è che abbiamo variabili casuali con distribuzioni identiche ... ma non riesco a vedere una giustificazione in un contesto politico: perché dovrebbe la distribuzione si mette sul mio voto e il vostro essere lo stesso a tutti ?
user541686

Inoltre, non sono nemmeno sicuro che la legge dei grandi numeri giustifichi ciò che stavi cercando di giustificare anche se le sue ipotesi sono soddisfatte. La domanda riguarda le dimensioni dei campioni che la legge dei grandi numeri non affronta realmente (almeno non nel modo che hai suggerito); abbiamo bisogno di qualche nozione della varianza o del tasso di convergenza qui, non solo della convergenza della media all'infinito. Forse intendevi invocare il teorema del limite centrale piuttosto che la legge dei grandi numeri? (Anche se per favore vedi il mio commento precedente dato che questo è probabilmente discutibile.)
user541686

2
Le distribuzioni non vengono applicate ai singoli voti. I voti individuali non sono casuali. Sono applicati al comportamento di voto della popolazione nel suo insieme. È come disegnare palle colorate da un'urna: ogni palla è predeterminata per essere rossa o blu, ma puoi avere una probabilità di disegnare ogni colore e quindi puoi costruire una distribuzione per la probabilità di disegnare un certo colore di palla basato su un campione delle palle nell'urna
J. Antonio Perez

1
Vediamo qualcosa di diverso dalla politica con le persone. Il sapore preferito del gelato di qualcuno dipende da tante cose quanto le sue opinioni politiche. Potrebbe dipendere dalle preferenze dei loro amici, ricordi affettuosi della loro infanzia, esperienze positive o negative nella gelateria. Forse a loro piace un sapore perché l'hanno ottenuto al loro primo appuntamento con la moglie o il marito. Forse a loro non piace un sapore perché ricorda loro il loro ex. Ma se avessi un sondaggio casuale di persone in America, non saresti d'accordo sul fatto che potrei giudicare i migliori gusti di gelato preferiti in America?
J. Antonio Perez,

1
La "variabile casuale" è la persona selezionata dal sondaggista a cui viene chiesta la preferenza. La preferenza di un individuo non è casuale; quale individuo il sondaggista seleziona è casuale.
J. Antonio Perez,

7

Innanzitutto, questo è a parte i punti principali, ma vale la pena menzionarlo. Nella sperimentazione medica potresti avere 1000 persone che testano un farmaco che può essere somministrato a 10000 persone che si ammalano ogni anno. Potresti guardarlo e pensare "È in fase di test sul 10% della popolazione", in realtà la popolazione non è 10000 persone, sono tutti i pazienti futuri, quindi la dimensione della popolazione è infinita. 1000 persone non sono grandi rispetto agli infiniti potenziali utilizzatori del farmaco, ma questo tipo di studi funziona. Non è importante testare il 10%, 1% o 0,1% della popolazione; l'importante è la dimensione assoluta del campione, non quanto è grande rispetto alla popolazione.

Successivamente, il punto principale è che ci sono così tante variabili confuse che possono influenzare il voto delle persone. Stai trattando i 22000 distretti della California come 22000 variabili, ma in realtà sono solo una manciata di variabili (reddito e istruzione come hai menzionato). Non hai bisogno di un campione rappresentativo di ogni distretto, hai solo bisogno di campioni sufficienti per coprire la variazione dovuta a reddito, istruzione, ecc.

Se hai K variabili confondenti (età, genere, istruzione, ect) e tutti hanno effetti simili, quindi la varianza del voto aumenta di circa Kvolte. Se campionaten le persone quindi la varianza della media del campione diminuisce di un fattore di n. Pertanto, se la variazione da ciascuna variabile confondente èσ2 quindi la media del campione da n persone con K saranno variabili confondenti Kσ2n.

Probabilmente puoi pensare a circa 10 variabili così confuse, ma la dimensione del campione è 1000 K è molto più piccolo di n. Pertanto la varianza della media del campione è piuttosto piccola.

Modificare:

La formula sopra presupponeva che ogni variabile confondente fosse ugualmente importante. Se vogliamo considerare centinaia di cose che possono aggiungere varianza ai risultati, questo presupposto non è valido (ad esempio, forse gli utenti di Twitter supportano un altro candidato, ma sappiamo che l'uso di Twitter non è importante quanto il genere).

Potremmo elencare tutte le variabili confondenti in ordine di importanza (ad esempio sesso, età, reddito, ..., uso di Twitter, ...). Supponiamo che ogni variabile sia importante solo del 90% rispetto alla precedente. Ora se il genere aggiunge una varianza uguale aσ2 quindi l'età aggiunge una varianza uguale a 0.9σ2 e il reddito aggiunge 0.92σ2. Se includiamo un numero infinito di variabili confondenti, allora la variabilità totale èΣn=0σ20.9n=10σ2.

Con questo tipo di considerazione per le variabili minori abbiamo finito con una varianza con una variabilità 10 volte superiore al solo genere. Quindi conn campiona la variazione nella media del campione è 10σ2n. Ovviamente0.9 è stato scelto in modo arbitrario, ma ciò trasmette un punto su come questo numero infinito di variabili minori dovrebbe sommarsi a qualcosa di piccolo


Grazie per la risposta! Per quanto riguarda il primo punto, suppongo sia vero, ma il mio punto era che non importa nemmeno quale sia la dimensione della popolazione umana poiché hai un fattore di forzatura (DNA, ecc.) Che renderebbe i risultati abbastanza simili per qualsiasi campione. Per quanto riguarda la seconda, però: posso comprare che in pratica potrebbero esserci alcune variabili, ma l'unico modo per giustificare matematicamente tale ipotesi e utilizzarlo in seguito è in realtà campionare prima un gran numero di persone e dimostrarlo, giusto? Senza questo, la conclusione non sembra più statisticamente rigorosa o giustificabile.
user541686

Abbiamo dimostrato per esperimento che età, genere, reddito e pochi altri sono fattori chiave nel modello di voto delle persone e lo sappiamo anche solo da conoscenze generali. Hai ragione sul fatto che potrebbero esserci centinaia di altri piccoli fattori che influenzano i voti e che in teoria potrebbero sommarsi a qualcosa di significativo, ma la nostra conoscenza generale ci dice che non sono importanti. A questo punto il modello non è rigorosamente giustificato, ma chi metterà alla prova fattori minori come "Essere biondi fa votare la gente per Clinton? Indossare una parrucca fa votare la gente per Trump?".
Hugh,

"ma chi testerà fattori minori come [...]" - ma questo è il problema qui. Se la risposta è "perché è la migliore che possiamo praticamente fare / perché funziona così / perché è costoso altrimenti / ecc.", Questa è una risposta perfettamente valida per la domanda "Perché non stanno sondando 100.000 persone? ", ma in realtà non è una risposta a" Come possono essere statisticamente giustificabili 1.000 persone? ". Ecco perché lo sto chiedendo su Stats.SE al contrario di Politics.SE ... Non mi interessa se più campioni non sono pratici; la mia domanda è perché le persone pensano che i metodi attuali siano statisticamente giustificati.
user541686

Le prime due frasi dell'ultimo commento sembrano essere una risposta ragionevole, se stai dicendo che quel tipo di studio è stato fatto su larga scala (~ centinaia di migliaia se non milioni di persone) e che questa è la fondamento dei nostri presupposti. In tal caso, penso che dovrebbero essere aggiunti alla tua risposta poiché affrontano il nocciolo della mia domanda (idealmente con un po 'di citazione, anche se non posso davvero essere troppo esigente dato che è un po' tangente e questo non è Politics.SE ).
user541686

Hai ragione sul fatto che testare fattori minori non è pratico ma matematicamente rilevante. Ho modificato la mia risposta per fornire alcuni ragionamenti sul perché non siamo preoccupati per centinaia di piccoli fattori che influenzano il risultato. Sono sicuro che puoi trovare ricerche fatte sull'influenza del fattore principale.
Hugh,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.